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内 容 简 介 


SPSS 具有 强大 的 统计 分 析 和 绘图 功能 ， 其 所 提供 的 各 种 统计 模块 可 用 于 完成 包括 基本 的 描述 性 统计 分 析 
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本 书 在 前 三 版 畅销 书 的 基础 上 ， 根 据 SPSS 24. 0 软件 升级 的 市 场 应 用 需求 进行 第 4 次 升级 修订 ， 书 中 结 
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容 的 实用 性 , 不仅 详细 介绍 了 SPSS 软件 常用 的 操作 功能 ， 最 后 还 通过 一 些 综合 应 用 案例 (在 医学 、 经 济 管理 、 
自然 科学 和 社会 科学 中 的 应 用 ) 来 演示 实际 统计 分 析 中 SPSS 的 使 用 。 
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和 卫生 统计 等 专业 学 生 学 习 大 数据 分 析 工具 掌握 SPSS 软件 的 用 书 , 也 可 作为 从 业 人 员 相 关 研究 人 员 以 及 作为 
相关 培训 机 构 的 参考 教材 。 
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为 什么 学 习 SPSS 


SPSS 的 英文 全 称 为 Statistical Package for Social Science， 即 社会 科学 统计 软件 ， 是 当今 世 
界 上 最 优秀 的 统计 软件 之 一 ， 其 提供 了 先进 成 熟 、 操 作 简便 的 统计 方法 ， 并 且 能 够 与 其 他 软件 
很 好 地 交互 ， 被 广泛 应 用 于 经 济 管理 、 医 疗 卫 生 、 自 然 科学 等 领域 。 

SPSS 软件 强大 的 统计 分 析 过 程 ， 可 以 实现 通用 统计 分 析 方法 、 多 元 统计 方法 和 专业 统计 
分 析 的 绝 大 部 分 功能 ， 是 用 户 进行 科学 研究 和 数据 分 析 的 绝 佳 利器 。 掌 握 SPSS 软件 已 成 为 经 
济 管理 、 卫生 政策 、 公 共 政 策 和 工程 管理 专业 的 在 校 研究 生 和 本 专科 生 及 这 些 领 域 的 从 业 人 员 
所 必 备 的 技能 。 


本 书写 作 和 内 容 


本 书 全 面 系 统 地 介绍 了 SPSS 的 统计 分 析 功 能 ， 将 统计 分 析 方 法 、SPSS 操作 和 实例 分 析 
有 机 结合 。 在 前 三 版 畅销 书 的 基础 上 ,根据 SPSS 24.0 软件 升级 的 市 场 需求 进行 第 4 次 改版 修 
订 ， 在 每 一 章 前 先 简明 扼要 地 阐述 SPSS 24.0 中 常用 统计 方法 的 基本 原理 ， 然 后 介绍 统计 方法 
分 析 的 操作 步骤 , 最 后 演示 具体 实例 并 对 其 输出 结果 进行 解读 , 藉 此 让 读者 对 方法 应 用 与 软件 
操作 有 一 个 统一 的 认识 。 

全 书 共 20 章 ， 分 四 部 分 ， 各 部 分 的 主要 内 容 如 下 。 

第 一 部 分 是 SPSS 入 门 。 本 部 分 包括 第 1 章 和 第 2 章 ， 主 要 介绍 SPSS 中 的 一 些 基 本 概念 
和 数据 文件 的 基本 操作 。 

第 二 部 分 是 SPSS 基本 统计 分 析 。 内 容 为 第 3 一 15 章 ， 主 要 包括 SPSS 基本 统计 分 析 、 参 
数 与 非 参数 检验 、 方 差分 析 、 相 关 分 析 、 回 归 分 析 、 对 应 分 析 、 聚 类 分 析 、 判 别 分 析 、 因 子 分 
析 、 主 成 分 分 析 和 时 间 序 列 分 析 等 ， 该 部 分 涵盖 了 一 般 统 计 分 析 、 多 元 统计 分 析 和 回归 分 析 中 
的 主要 分 析 方 法 。 

第 三 部 分 是 SPSS 高 级 统计 分 析 。 内 容 为 第 16 一 18 章 ， 主 要 包括 信 度 分 析 、 生 存 分析 和 
缺失 值 分 析 等 。 该 部 分 内 容 用 户 可 以 根据 需要 进行 选择 学 习 。 

第 四 部 分 是 SPSS 图 形 绘制 与 综合 案例 操作 。 内 容 为 第 19 章 和 第 20 章 ， 主 要 介绍 SPSS 
常用 统计 图 形 的 绘制 方法 以 及 在 实际 统计 分 析 中 SPSS 的 应 用 。 

本 书 实例 典型 ， 内 容 丰 富 ， 有 很 强 的 针对 性 。 书 中 不 仅 详细 介绍 了 实例 的 具体 操作 步 又， 
而 且 各 章 还 配 有 一 定数 量 的 练习 题 供 读者 练习 使 用 ,读者 只 需要 按照 书 中 介绍 的 步骤 一 步 步 地 
实际 操作 ， 就 能 完全 掌握 本 书 的 内 容 。 


本 书 有 了 哪些 特点 


1. 概念 讲解 清晰 ， 操 作 演 示 细 致 实用 

本 书 在 介绍 每 一 种 统计 方法 的 应 用 之 前 ,会 先 讲解 相应 统计 方法 的 相关 统计 知识 和 注意 事 
项 ， 读 者 在 学 习 SPSS 的 操作 之 前 可 以 对 此 进行 简要 地 复习 ， 做 到 “ 知 其 然 也 知 其 所 以 然 ”。 
对 于 每 一 种 统计 方法 在 SPSS 中 的 操作 ， 作 者 尽 可 能 地 对 所 有 的 参数 、 按 钮 、 对 话 框 的 功能 进 
行 讲解 ， 读 者 可 以 举一反三 ， 全 面 掌握 软件 中 圳 括 的 统计 方法 的 应 用 。 

2. 丰富 的 案例 和 上 机 题 

每 一 种 统计 分 析 方 法 都 会 配 以 详细 的 案例 讲解 , 案例 具有 很 强 的 针对 性 , 并 对 结果 进行 剖 
析 。 每 章 后 面 的 上 机 题 可 以 作为 对 前 面 知 识 讲解 的 深入 和 补充 , 通过 上 机 题 来 检验 对 本 章 内 容 
的 掌握 程度 。 

3. 提供 丰富 的 配套 视频 下 载 

作者 为 本 书 录 制 了 1300 多 分 钟 可 供 下 载 的 视频 教学 文件 ， 虽 以 SPSS 17.0 版 本 录制 ， 但 
视频 对 书 中 案例 进行 了 详细 讲解 ， 亦 适合 SPSS 18.0~24.0 版 本 的 所 有 用 户 ， 同 时 提供 了 技术 
教学 视频 ， 以 帮助 用 户 掌握 新 旧版 本 软件 的 使 用 。 通 过 培训 机 构 学 习 这 些 内 容 ， 至少 要 花费 几 
千 元 , 即便 在 培训 网 站 购买 作者 同 级 别 的 教学 视频 也 是 不 菲 的 开销 , 本 书 将 这 些 视 频 免费 提供 
给 用 户 下 载 。 

读者 可 以 从 以 下 地 址 下 载 本 书 的 视频 教学 〈 注 意 区 分 数字 和 英文 字 中 Hn 
母 大 小 写 ) ， 也 可 扫描 二 维 码 进行 下 载 。 下 


https://pan.baidu.cormy/s/1eKeE6IKSIL_RsresOXWDKvw 


如 果 下 载 有 问题 ， 可 发 送 电 子 邮 件 至 booksaga@126.com 获得 帮助 ， 
邮件 标题 为 “SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 下 载 资源 ”。 


本 书 适合 哪些 读者 


本 书 既 可 以 作为 高 校 经 济 学 、 管 理学 、 统 计 学 、 公 共管 理 、 社 会 学 和 卫生 统计 等 专业 学 生 
掌握 SPSS 软件 的 学 习 用 书 ， 也 可 作为 从 业 人 员 和 相关 研究 人 员 以 及 培训 机 构 的 参考 教材 。 

本 书 由 杨 维 忠 、 陈 胜 可 、 刘 荣 编 写 ， 因 软件 版 本 升级 ， 本 书 第 4 版 的 修订 内 容 由 王国 平 、 
王国 辉 、 施 妍 然 、 王 国 春 、 王 然 等 人 完成 。 由 于 作者 水 平 有 限 ， 书 中 的 缺点 甚至 错误 在 所 难免 ， 
恳请 广大 读者 批评 指正 。 

作者 力图 使 本 书 的 知识 性 和 实用 性 相得益彰 ,但 由 于 水 平 有 限 ， 书 中 难免 存在 错误 、 丝 漏 
之 处 ， 欢 迎 广大 读者 、 同 仁 批评 斧 正 。 


编 者 
2018 年 12 月 
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第 1 章 SPSS 24.0 概述 


SPSS 全 称 Statistical Package for Social Science， 即 社会 科学 统计 软件 ， 其 具有 统计 方法 先 
进 成 熟 、 操 作 简 便 ， 与 其 他 软件 交互 性 好 等 特点 ,被 广泛 应 用 于 经 济 管理 、 医 疗 卫 生 、 自 然 科 
学 等 各 个 方面 。 

SPSS 使 用 的 是 图 形 交 互 式 用 户 界面 ， 界 面 友 好 且 操 作 简单 ， 用 户 只 需要 通过 菜单 即 可 完 
成 大 部 分 操作 。 它 还 提供 了 与 多 种 应 用 软件 的 接口 , 支持 多 种 格式 的 数据 文件 ， 用户 可 以 方便 
地 将 其 他 格式 的 数据 文件 导入 SPSS。 

除了 包含 常用 的 基本 统计 方法 以 外 ，SPSS 还 可 以 进行 生存 分 析 、 信 度 分 析 等 专业 的 统计 
分 析 方法 ，SPSS 的 数据 结果 可 读 性 强 且 容易 导出 ， 极 大 地 方便 了 用 户 的 应 用 和 保存 。 

SPSS 软件 在 引入 我 国 后 ， 因 其 强大 的 数据 分 析 处 理 能 力 和 简单 友好 的 界面 ， 已 经 被 广泛 
应 用 于 多 个 领域 实现 数据 分 析 与 信息 管理 工作 ， 受 到 广大 科研 人 员 与 应 用 工作 者 的 深度 好 评 。 


1.1 SPSS 24.0 简介 


SPSS 自 1968 年 推出 以 来 历经 了 多 次 改版 ， 现 最 新 版 本 为 SPSS 24.0。SPSS 软件 于 2009 
年 被 IBM 公司 收购 ， 现 被 更 名 为 IBM SPSS。SPSS 24.0 在 保留 了 以 往 版 本 优良 特性 的 基础 上 
又 增加 了 一 些 新 的 功能 模块 ， 使 得 功能 更 加 强大 ,操作 上 更 突出 个 性 化 , 更 好 地 适应 了 不 同 用 
户 群 体 的 数据 分 析 需 求 。 


1.1.1 SPSS 24.0 的 新 增 功能 
SPSS 24.0 的 新 增 功能 有 : 


。 可 以 指定 将 定制 对 话 框 安装 到 创建 的 子 菜单 ， 也 可 指定 是 将 定制 对 话 框 安装 到 所 有 窗口 类 
型 ( “数据 编辑 器 ”和 “语法 ” ) ， 或 仅 安装 到 特定 窗口 类 型 。 

。 支持 以 下 控件 : 字段 选择 器 、 数 据 集 选择 器 、 日 期 控件 、 安 全 文本 控件 、 颜 色 选 取 器 、 表 
控件 和 选项 卡 控件 。 

[以 根据 其 他 控件 的 状态 启用 或 禁用 控件 。 

[以 指定 目标 列表 的 最 小 或 最 大 字段 数 ， 以 及 多 选 列 表 框 的 最 小 或 最 大 所 选项 数 

可 以 指定 组 合 框 控件 是 否 可 编辑 。 若 控件 可 编辑 ， 会 在 运行 时 输入 定制 值 。 

可 以 将 标签 放 在 以 下 控件 的 左 侧 : 组 合 框 、 文 本 控件 、 数 字 控 件 和 文件 浏览 器 。 

针对 生成 项 列表 的 控件 ， 可 在 生成 的 语法 选项 之 问 指定 定 界 符 ， 此 属性 适用 于 目标 列表 、 

字段 选择 器 、 表 控件 和 列表 框 控件 。 

。 可 以 指定 以 下 控件 类 型 的 文本 区 域 宽度 : 文件 控件 、 数 字 控 件 和 安全 文本 控件 。 

。 可 以 指定 如 何 处 理 带 单 引号 或 双 引 号 的 值 中 内 部 引号 ， 此 属性 适用 于 以 下 控件 类 型 : 文本 
控件 、 表 控件 、 组 合 框 和 列表 框 。 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 
1.1.2 ”运行 环境 要 求 


运行 SPSS 24.0 对 计算 机 的 环境 要 求 并 不 高 ， 一 般 的 硬件 配置 即 可 。 若 SPSS 的 运算 涉及 
大 量 数据 ， 则 需要 用 户 配置 较 大 的 内 存 。 对 于 较 大 的 数据 处 理 和 复杂 的 统计 运算 , 计算 机 至 少 
需要 256MB 内 存 。 

SPSS 24.0 对 计算 机 硬件 的 基本 要 求 如 下 : 


。 以 1GHz ( 千 光 赫兹 ) 或 更 高 频率 运行 的 Intel 或 AMD 处 理 器 。 

。 最 低 1GBRAM (Random Access Memory， 随 机 存储 器 ) 。 

e 至 少 800 MB 内 存 . 注意 , 若 安 装 一 种 以 上 的 帮助 语言 , 每 多 一 种 语言 则 需要 增加 150~170 
MB 的 磁盘 空间 。 

。 DVD/CD 光盘 驱动 器 。 用 于 安装 SPSS 24.0 软件 。 若 用 户 通 过 网 络 安装 软件 ， 则 无 须 配 置 
此 项 。 

。 XGA (1024 x768 ) 或 更 高 分 辨 率 的 显示 器 。 

。 运行 TCP/IP 网 络 协议 的 网 络 适配器 。 用 于 访问 IBM SPSS 公司 的 网 站 以 获得 相应 的 技术 
支持 和 软件 升级 。 

SPSS 24.0 对 操作 系统 的 最 低 要 求 为 : Microsoft Windows XP (32 位 版 本 ) 、Windows Vista 

(32 位 和 64 位 版 本 ) 或 Windows7 (32 位 和 64 位 版 本 ) 。 


1.2 SPSS 24.0 的 启动 、 退 出 与 常用 界面 窗口 


SPSS 软件 全 面 支持 Windows 操作 系统 ， 其 基本 操作 方式 和 界面 窗口 与 一 般 软件 相同 ， 操 
作 十 分 简便 。 


1.2.1 SPSS 24.0 的 启动 与 退出 


SPSS 24.0 的 启动 和 退出 方式 与 Windows 操作 系统 下 的 一 般 软 件 完全 相同 。 
1. SPSS 24.0 的 启动 


安装 后 双击 桌面 上 的 SPSS Statistics 24.0 图 标 ， 或 者 在 “开始 ”菜单 中 依次 选择 “程序 ” 
| IBM SPSS Statistics | IBM SPSS Statistics 24 命令 。 启动 后 会 出 现 如 图 1-1 所 示 的 启动 界面 , 该 
界面 给 出 了 SPSS 的 版 本 等 信息 。 之 后 会 出 现 启动 选项 界面 (如 图 1-2 所 示 ) ,提示 SPSS 24.0 
成 功 启 动 。 

SPSS 有 4 个 启动 选项 : “新 建文 件 ”“ 新 增 功能 ”“ 最 近 的 文件 ”“ 入 门 ”。 


。 新 建文 件 : 选择 此 项 , 系统 将 输入 数据 编辑 窗口 , 用户 可 以 建立 新 的 数据 文件 或 输入 数据 。 
。 新 增 功能 : 选择 此 项 后 ， 用 户 可 以 查看 SPSS 24.0 的 新 增 功能 。 

。 最 近 的 文件 : 选择 此 项 后 ， 系 统 会 让 用 户 选择 运行 一 个 SPSS 数据 文件 。 

。 入 门 : 可 以 浏览 运行 指导 和 教程 等 。 
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图 1-1 SPSS 24.0 的 启动 界面 图 1-2 ”SPSS 启动 选项 
2. SPSS 24.0 的 退出 


在 菜单 栏 中 选择 “文件 ” |“ 退出 ”命令 ， 或 者 单 击 数据 编辑 窗口 右上 角 的 “关闭 ”按钮 ， 
都 可 以 退出 SPSS 。 


1.2.2 ”SPSS 24.0 的 界面 与 窗口 


SPSS 的 基本 界面 包括 主 窗口 〈 数 据 编辑 窗口 ) 、 结 果 输 出 窗口 、 对 象 编辑 窗口 、 语 法 编 
辑 器 窗口 和 脚本 编写 窗口 ， 下 面 分 别 介绍 如 下 。 


主 窗口 〈 数 据 编辑 窗口 ) 


如 果 在 启动 选项 中 选择 “输入 数据 ”或 “打开 现 有 的 数据 源 ”， 输 入 SPSS 后 的 第 一 个 窗 
口 就 是 数据 编辑 窗口 ， 如 图 1-3 所 示 。 


| 起 天 是 1 | 数理 类] - IBM SPSS Statistics 类 琵 册 等 加 


TBM SPSS Statisics 好 里 程序 可 


图 1-3 SPSS 的 数据 编辑 窗口 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


关于 数据 编辑 窗口 我 们 将 在 第 2 章 详 述 ， 在 此 不 多 做 介绍 。 
结果 输出 窗口 
结果 输出 窗口 用 于 输出 SPSS 统计 分 析 的 结果 或 绘制 的 相关 图 表 ， 如 图 1-4 所 示 。 
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1-4 SPSS 的 结果 输出 窗口 


结果 输出 窗口 左边 是 导航 窗口 ,其 显示 输出 结果 的 目录 , 单 击 目录 前 边 的 加 、 减 号 可 以 显 
示 或 隐藏 相 关 的 内 容 ， 右 面 是 显示 窗口 ， 显 示 所 选 内 容 的 细节 。 


对 象 编辑 窗口 


在 结果 输出 窗口 的 显示 窗口 中 右 击 ， 在 弹出 的 快捷 菜单 中 依次 选择 “编辑 内 容 ”|“ 在 单 
独 窗口 中 ”命令 ,或 者 直接 双击 其 中 的 表格 或 图 形 均 可 打开 该 输出 结果 对 应 的 对 象 编辑 窗口 ， 
图 1-5 所 示 。 


页 得 现 夫 增 注 统计 - oO x 
文件 E 。_ 编 辑 癸 ) ”查看 WD 托 入 W)。 衣 视 E) 格式 (Q)_ 半 风 LH) 


每 50 个 (中 
最 大和 25 位 千 ) 75 


下 新 准 
个 科 主导 31 4821.941061 1551.482417 30894382 3683.457000 。 4181 671000 5364147000 
太 物 消 入 3 1194364410 4066217417 5031145 24256928 967689400 1141859000 1334.6554900 
居住 消费 31 3496066019 2201.914265 13745683 11307.4924 2387.868700 2743358100 3471.597700 
训 丰 设备 31 93454577! 3303303024 3948702 。 20982916 698762000 883599500 1047528900 
ET 31 2094194697 B78.2079874 10258628 44896343 1537130000 1783100700 2: 

文 台 如 和 31 1716414235 667.3827082 3140894 。 37181168 1557.328500 2 

ER 全 31 1204759084 4214645630 。 229 2683335 1117 925800 1 

开 龙 消费 31 393760142 198.1502460 1694923 。 991.4092 315.289800 


1-5 SPSS 的 对 象 编辑 窗口 


在 对 象 编辑 窗口 中 我 们 可 以 对 表格 、 图 表 等 对 象 进行 相应 的 编辑 操作 。 有 具体 的 编辑 操作 ， 
将 在 本 书后 面相 关 章 节 详细 介绍 。 
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语法 编辑 器 窗口 
选择 菜单 栏 中 的 “文件 ” |“ 新建”|“ 语 法 ”命令 或 “文件 ” |“ 打开 ”|“ 语 法 ”命令 ， 均 
可 打开 语法 编辑 器 窗口 ， 如 图 1-6 所 示 。 


[En a 
XND MME) EEO SND WAD HFS Wb MUG SNRND Be) IAG YR Wom WD 


1-6 SPSS 的 语法 编辑 器 窗口 


用 户 可 以 在 语法 编辑 器 窗口 中 输入 或 修改 SPSS 命令 , 或 者 单 击 任何 分 析 对 话 框 中 的 粘贴 
按钮 ， 将 使 用 对 话 框 设置 的 各 种 命令 或 选项 粘贴 到 语法 编辑 器 窗口 中 。 


脚本 编写 窗口 


选择 菜单 栏 中 的 “文件 ”|“ 新 建 ”|“ 脚 本 ”命令 或 “文件 ”|“ 打 开 ”|“ 脚 本 ”命令 ， 均 
可 打开 如 图 1-7 所 示 的 脚本 编写 窗口 。 
图 Script * (script) - SPss Statistics Basic Script Editor ER 去 口 
文件 月 ”篇 给 查理 V) 去 (M) 油 江 ID) 工作 雪 姑妈 (H) 


CECA": 
司 rm: foie 


To 


日 
EEESFY 


1-7 SPSS 的 脚本 编写 窗口 
用 户 可 以 在 此 窗口 中 编写 SPSS 内 和 嵌 的 Sax Basic 语言 ， 以 形成 自动 化 处 理 数据 的 程序 。 


1.3 ”SPSS 24.0 的 系统 参数 设置 


完成 SPSS 24.0 的 安装 后 ， 首 先 通 过 “选项 ”对 话 框 设置 SPSS 的 相关 参数 ， 用 户 所 设 参 
数 可 以 自动 保存 ， 无 须 再 次 进行 设置 。 
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选择 菜单 栏 中 的 “编辑 ”|“ 选 项 ”命令 ， 打 开 如 图 1-8 所 示 的 “选项 ”对 话 框 。 
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图 1-8 “选项 ”对 话 框 


1.3.1 常规 参数 设置 


“常规 ”选项 卡 可 以 设置 SPSS 的 各 种 通用 参数 ， 包 括 以 下 几 个 选项 组 的 内 容 (所 设 参数 
可 自动 保存 ， 再 次 启动 SPSS 时 无 须 重新 设置 ) 。 


1.“ 变 量 列 表 ” 选 项 组 


该 “变量 列表 ”选项 组 用 于 设置 变量 在 变量 表 中 的 显示 方式 与 显示 顺序 。 显 示 方 式 可 选择 
“显示 标签 ”或 “显示 名 称 ”。 如 选择 “显示 标签 ”， 则 变量 标签 显示 在 前 ， 如 选择 “显示 名 
称 ”， 则 只 显示 变量 名 称 。 

2.“ 角 色 ” 选 项 组 


该 选项 组 为 较 新 版 本 SPSS 软件 中 的 新 增 内 容 ， 其 来 源 于 数据 挖掘 方法 体系 的 要 求 。 为 节 
省 时 间 ， 提 高 效率 ， 某 些 对 话 框 允许 使 用 预定 义 角色 ， 然 后 自动 将 变量 分 配 到 变量 列表 中 。 可 
用 角色 如 下 : 


输入 : 变量 将 用 作 输 入 (如 自 变量 、 预 测 变量 ) 。 

目标 : 变量 将 用 作 输 出 或 目标 ( 如 因 变 量 ) 。 

两 者 : 变量 将 同时 用 作 输 入 和 输出 。 

无 : 变量 没有 角色 分 配 ， 即 不 被 纳入 分 析 。 

分 区 : 变量 被 用 于 将 数据 划分 为 单独 的 训练 、 检 验 和 验证 样本 。 
拆 分 : 具有 此 角色 的 变量 不 会 在 SPSS 中 被 用 作 拆 分 文件 变量 。 


SPSS 默认 为 所 有 变量 分 配 输入 角色 。 注 意 ， 角 色 分 配 只 影响 支持 角色 分 配 的 对 话 框 ， 而 
此 类 对 话 框 在 现 有 版 本 的 SPSS 中 较 少 。 一 般 情况 下 ， 该 选项 使 用 默认 设置 即 可 。 
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3.“ 输 出 ”选项 组 

该 选项 组 主要 设置 SPSS 的 输出 风格 。“ 测 量 系统 ”下 拉 列 表 框 用 于 设置 SPSS 的 度量 参 
数 ， 可 以 选择 “英寸 ” “厘米 ”和 “ 磅 ”等 单位 ; 选中 “没有 用 于 表 中 较 小 的 数字 的 科学 记 数 
法 ” 复 选 框 ， 则 输出 结果 中 将 把 非常 小 的 小 数 以 0 代替 。 

“通知 ”选项 包括 “弹出 查看 器 窗口 ”和 “滚动 到 新 输出 ”两 个 复 选 框 。 选 中 “弹出 查看 
器 窗口 ” 复 选 框 ，SPSS 会 在 有 新 的 结果 时 自动 打开 视图 窗口 ; 选中 “滚动 到 新 输出 ” 复 选 框 ， 
SPSS 会 自动 在 视图 窗口 中 滚动 到 新 输出 。 

4.“ 窗 口 ”选项 组 

“外 观 ” 下 拉 列 表 框 用 于 设置 SPSS 的 整体 外 观 风格 , 包括 Windows、SPSS Classic 和 SPSS 
Standard 3 种 风格 。 另 外 ， 选 中 “启动 时 打开 语法 窗口 ” 复 选 框 ，SPSS 启动 时 将 打开 语法 窗 
口 。 若 选中 “一 次 只 打开 一 个 数据 集 ” 复 选 框 ，SPSS 将 关闭 多 数据 集 支 持 功能 ， 用 户 打开 新 
数据 集 时 必须 将 原先 打开 的 数据 集 关 闭 。 


1.3.2 ”查看 器 参数 设置 


“查看 器 ”选项 卡 主要 用 于 设置 输出 窗口 的 字体 、 图 标 等 选项 ， 如 图 1-9 所 示 。 
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图 1-9 “查看 器 ”选项 卡 

1. “初始 输出 状态 ”选项 组 

该 选项 组 用 于 设置 输出 结果 的 初始 状态 参数 。 首 先 在 “项 ”下 拉 列 表 框 中 选择 要 设置 的 输 
出 结果 ， 然 后 在 下 面 设置 所 选 内 容 的 输出 参数 。 

“选项 ”下 拉 列 表 框 中 包括 日 志 、 和 警告 、 备 注 、 标 题 、 页 面 标题 、 透 视 表 、 图 表 、 文 本 输 
出 、 树 模型 和 模型 查看 器 。“ 初 始 内 容 ” 可 “显示 ”或 “隐藏 ”; 在 “对 齐 ” 下 选择 对 齐 方 式 ; 
如 果 选 中 “在 日 志 中 显示 命令 ” 复 选 框 ，SPSS 将 在 日 志 中 输出 命令 语句 。 

2. “标题 ”“ 页 面 标题 ”和 “文本 输出 ”选项 组 

这 3 个 选项 组 分 别 用 于 设置 标题 、 页 面 标题 和 文本 输出 的 字体 、 字 号 、 颜 色 等 。 
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1.3.3 ”数据 参数 设置 


“数据 ”选项 卡 用 于 设置 数据 处 理 过 程 中 的 相关 参数 ， 如 图 1-10 所 示 。 
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[eh 东信 
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图 1-10 “数据 ”选项 卡 
1. “转换 与 合并 选项 ”选项 组 


如 选中 “立即 计算 值 ” 单 选 按 钮 ， 数 据 转换 、 文 件 合并 操作 将 在 单 击 “ 确 定 ” 按 钮 后 立即 
执行 ， 如 选中 “在 使 用 前 计算 值 ” 单 选 按 钮 。 将 会 延迟 转换 。 只 有 在 遇 到 命令 时 ， 才 进行 转换 
和 合并 ， 数 据 文件 较 大 时 ， 一 般 选用 这 种 格式 。 


2. “新 数字 变量 的 显示 格式 ”选项 组 


该 选项 组 包括 “宽度 ”与 “小 数位 数 ” 两 个 微调 框 , 用 于 设置 数值 变量 的 宽度 与 小 数位 数 ， 
如 图 1-10 所 示 。 


3. “随机 数 生成 器 ”选项 组 


该 选项 组 用 于 选择 使 用 的 随机 数字 生成 器 。 选 中 “与 SPSS 12 及 之 前 版 本 兼容 " 单 选 按钮 ， 


系统 使 用 SPSS 12 或 之 前 的 随机 数据 生成 器 ; 选中 “长 周期 梅森 旋转 算法 ” 单 选 按钮 ， 系 统 则 
使 用 梅森 旋转 算法 作为 随机 数据 生成 器 。 


4. “数字 值 的 四 舍 五 入 与 截断 ”选项 组 
对 于 RND 和 TRUNC 函数 ， 此 选项 组 控制 该 对 值 进行 四 舍 五 入 的 默认 准 值 。 
5. “设置 两 位 数 年 份 的 世纪 范围 ”选项 组 


该 选项 组 用 于 为 使 用 两 位 数 年 份 输入 和 显示 的 日 期 格式 变量 定义 年 份 范 围 .如 选择 “自动 ” 
单 选 按钮 ， 系 统 年 限 则 基于 当年 ， 前 推 69 年 ， 后 推 30 年 (加 上 当年 ， 整 个 范围 为 100 年 〉; 
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用 户 也 可 通过 选中 “定制 ” 单 选 按钮 自 定 义 年 份 的 变动 范围 。 
6. “定制 变量 视图 ”按钮 
设置 变量 视图 中 属性 的 默认 显示 和 顺序 。 
7. “更 改 字典 ”按钮 
设置 检查 变量 视图 中 项 目 拼写 的 字典 的 语言 。 


1.3.4” 自 定义 数值 变量 的 格式 参数 设置 


“货币 ”选项 卡 用 于 定制 自 定义 数值 变量 的 输出 格式 和 各 种 参数 ， 如 图 1-11 所 示 。 


二 


+ 刘 制 分隔 开 
50) 
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图 1-11 “货币 ”选项 卡 
1. “定制 输出 格式 ”选项 组 


此 选项 组 最 多 可 以 创建 5 种 自 定义 数据 显示 格式 ,格式 包括 特殊 的 前 组 和 后 缀 字符 以 及 对 
负 值 的 特殊 处 理 方式 。 自 定义 数据 显示 名 称 为 CCA、CCB、CCC、CCD 和 CCE, 右边 的 “ 样 
本 输出 ”选项 组 会 显示 相应 格式 的 预览 。 


2. “所 有 值 ”选项 组 


该 选项 组 包含 “前 级 ”与 “后 级 ”两 个 文本 框 ， 分 别 用 于 输入 所 有 值 的 前 组 与 后 级 。 
3. “ 负 值 ”选项 组 


该 选项 组 同样 包括 “前 缀 ”与 “后 级 ”两 个 文本 框 , 分 别 用 于 输入 所 有 负 值 的 前 组 与 后 级 ， 
系统 默认 前 级 为 “-”。 


4. “十 进 制 分 隔 符 ”选项 组 
该 选项 组 用 于 设置 小 数 分 隔 符 ， 有 “句点 ”和 “逗号 ”两 种 分 隔 符 可 以 选择 。 
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1.3.5 ”输出 窗口 的 参数 设置 


“输出 ”选项 卡 主要 用 于 设置 输出 结果 的 标签 选项 ， 如 图 1-12 所 示 。 


i 区 
a Ws 本 GE 
入 单 击 一 次 闹 吉 
于 葵 中 的 时 时 直 为 OO: 本 
重大 突现 才 (): |24 
站 在 纺 出 中 包括 林 志 C) 
而 本 苦 中 的 到 重信 叶 直 为 上 
| 符 tB 示 
显示 方法 : 
区 
ORE 
Os 
| 村 
二 视 末 村主 导入 
本 村 中 的 时 扣 未 为 国 卫衣 视 夫 中 每 个 单元 可 行列 标注) 
公克 季 至 另 一 单元 格 9 有 也 交 人 的 和 村 蔡 或 列 必 蔡 (Q) 
标签 中 的 次 鳃 值 叶 示 为 (ED): 
C3| 
EE ED 


图 1-12 “输出 ”选项 卡 
1. “大 纲 标注 ”选项 组 
该 选项 组 包括 “项 标签 中 的 变量 显示 为 ”和 ”项 标签 中 的 变量 值 显示 为 ”两 个 下 拉 列 表 框 ， 
分 别 用 于 设置 变量 标签 和 变量 值 的 显示 方式 。 两 个 下 拉 列 表 框 中 都 有 3 个 可 选项 : “标签 ”， 
使 用 变量 标签 标示 每 个 变量 ; “名 称 ”， 使 用 变量 名 称 标 示 每 个 变量 ; “标签 与 名 称 ”， 两 者 
都 使 用 。 


2. “透视 表 标注 ”选项 组 
该 选项 组 包含 内 容 及 其 设置 方式 与 “大 网 标注 ”选项 组 相同 ， 在 此 不 再 痪 述 。 


1.3.6 图表 输出 参数 设置 


“图 表 ” 选 项 卡 用 于 设置 图 表 输 出 时 的 各 种 参数 ， 如 图 1-13 所 示 。 

1. “图 表 模板 ”选项 组 

该 选项 组 包含 “使 用 当前 设置 ”和 “使 用 图 表 模 板 文件 ”两 个 单 选 按钮 。 如 选中 “使 用 当 
前 设置 ” 单 选 按钮 , 则 图 表 采 用 此 标签 中 设置 的 参数 ; 如 选中 “使 用 图 表 模板 文件 ” 单 选 按钮 ， 
则 使 用 一 个 图 表 模 板 来 确定 图 表 的 属性 ， 用 户 可 以 单 击 “ 浏 览 ”按钮 来 选择 图 表 模 板 。 


2. “当前 设置 ”选项 组 
“字体 ”下 拉 列 表 框 用 于 设置 新 图 表 中 所 有 文本 的 字体 。 
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起 x 
RA WA EE A A Sok, EE ES ZH ME Sh} 
图 表 借 板 一 
全 必用 当 前 设 秆 LU) 
个 翌 肌 图 者 模板 文件 [E) 芷 二 图 胡可 高 比 t) 1125 
当前 设置 
Em 
ao， | wo 
EL 
PERD: ER 
[E20 
] 诗风 
oac) | 
和 式 邓 征 
[EET "ED 
1-13 “图 表 ” 选 项 卡 


“样式 循环 首选 项 ”下 拉 列 表 框 用 于 设置 新 图 表 的 颜色 和 图 案 的 初始 分 配 , 包 含 两 个 选项 : 


“ 仅 在 颜色 之 间 循环 ”， 仅 使 用 颜色 区 分 图 表 元 素 ， 不 使 用 图 案 ; 
使 用 线条 样式 、 标 记 符号 或 填充 图 案 来 区 分 图 表 元 素 ， 不 使 用 颜色 。 


3. “框架 ”选项 组 


“ 仅 在 图 案 之 间 循 环 ”， 仅 


该 选项 组 用 于 控制 新 图 表 上 的 内 框 和 外 框 的 显示 ， 用 户 可 以 选择 显示 内 框 或 外 框 。 


4. “网 格 线 ” 选 项 组 


该 选项 组 用 于 设置 新 图 表 上 的 刻度 轴 网 格 线 和 类 别 轴 网 格 线 的 显示 。 


5. “样式 循环 ”选项 组 


该 选项 组 包含 “颜色 ”“ 线 条 ” “标记 ” “填充 ”4 个 按钮 ， 分 别 用 于 设置 新 图 表 的 颜色 、 


线条 样式 、 标 记 符号 和 填充 图 案 。 


1.3.7 ”透视 表 参 数 设 置 


“透视 表 ” 选 项 卡 用 于 设置 新 枢 轴 表 输 出 的 默认 表格 外 观 ， 如 图 1-14 所 示 。 


1. “ 表 外 观 ” 选 项 组 


该 选项 组 用 于 设置 表格 输出 的 外 观 样式 及 储存 路 径 。 用 户 可 以 在 列表 框 中 选择 一 种 外 观 样 


式 ， 也 可 以 单 击 “ 浏 览 ”按钮 选择 自 定义 的 外 观 样 式 。 
2.“ 列 宽 ” 选 项 组 


该 选项 组 用 于 控制 枢 轴 表 中 列 宽 的 自动 调整 。 
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图 1-14 “透视 表 ” 选 项 卡 


。。 仅 针对 标签 进行 调整 : SPSS 会 将 列 宽 调整 为 列 标签 的 宽度 ， 这 会 生成 结构 更 紧凑 的 表 ， 
但 宽度 超过 标签 的 数据 值 可 能 会 被 截 去 。 

e 针对 所 有 表 的 标签 和 数据 进行 调整 : SPSS 会 将 列 宽 调整 为 列 标签 或 最 大 数据 值 中 较 大 的 
宽度 。 


3. “ 缺 省 编辑 方式 ”下 拉 列 表 框 


用 于 控制 枢 轴 表 在 浏览 器 窗口 或 独立 窗口 中 的 激活 。SPSS 默认 双击 枢 轴 表 即 可 激活 浏览 
器 窗口 中 所 有 除 特大 表 之 外 的 表格 。 除 此 之 外 ， 用户 还 可 以 选择 在 独立 窗口 中 激活 枢 轴 表 , 或 
者 设置 一 个 大 小 , 使 小 于 这 个 设置 的 枢 轴 表 在 浏览 器 中 打开 , 而 大 于 这 个 设置 的 枢 轴 表 在 独立 
窗口 中 打开 。 

4. “将 宽 表 以 富 文本 格式 复制 到 剪贴 板 ” 下 拉 列 表 框 


该 下 拉 列 表 框 用 于 设置 以 Word/RTF 格式 粘贴 枢 轴 表 时 ， 文 档 宽度 较 大 的 表格 的 处 理 方式 。 


1.3.8 ”文件 位 置 参数 设置 


“文件 位 置 ”选项 卡 中 可 设置 应 用 程序 在 每 个 会 话 开始 时 打开 和 保存 文件 的 缺 省 位 置 、 日 志 
文件 位 置 、 临 时 文件 夹 位 置 ， 以 及 出 现在 最 近 使 用 的 文件 列表 中 的 文件 数量 ， 如 图 1-15 所 示 。 


1. “打开 对 话 框 和 保存 对 话 框 所 使 用 的 启动 文件 夹 ”选项 组 


该 选项 组 用 于 将 指定 的 文件 夹 用 作 每 个 会 话 开头 的 缺 省 位 置 ， 可 以 选择 “指定 的 文件 夹 ” 
为 数据 文件 和 其 他 文件 指定 保存 和 读 取 的 位 置 ， 也 可 以 选择 “最 近 一 次 使 用 的 文件 夹 ”将 在 上 
一 次 会 话 中 打开 或 保存 文件 的 最 后 一 个 文件 夹 ， 用 作 下 一 次 会 话 的 默认 文件 夹 。 


要 
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x 


打开 对 活 夫 和 保存 对 活 各 所 使 用 的 启动 件 夫 一 一 == 


站 所 文件 D): [CisersienangDocuments 


其 他 文件 O)。 [CusersshangDocuments 
〇 一 次 使 用 的 文件 夫 (L) 
9 
网 在 日 过 中 记录 三 去 CD) 
@E) OD 


上 ES 二 可 
本 
日 志文 件 (D: [CiUsers'snangDocuments WEMSPSS Stabstcs netatstcs my Erm 
EC 


六 | 扩 件 夫 QW): [CsersisnangwppDaaocanTemp 


要 9 各 过 使 有 文 上 支 0: [0 国 
Pynon 27 提 村 
| 


1-15 “文件 位 置 ”选项 卡 


2. “会 话 日 志 ” 选 项 组 

用 户 可 以 选中 “在 日 志 中 记录 语法 ” 复 选 框 ， 启 用 会 话 日 志 自 动 记录 会 话 中 运行 的 命令 ， 
可 以 通过 选择 “追加 ”或 “覆盖 ”设置 日 志文 件 的 记录 方式 。 此 外 ， 用 户 还 可 以 选择 日 志文 件 
的 名 称 和 位 置 。 


3. “临时 文件 夹 ”文本 杠 
该 文本 框 用 于 设置 在 会 话 过 程 中 创建 的 临时 文件 的 位 置 。 
4. “要 列 出 的 最 近 使 用 文件 数 ” 微 调 杠 

用 于 设置 出 现在 “文件 ”菜单 上 的 最 近 使 用 文件 的 数量 。 


1.3.9 ”脚本 文件 的 参数 设置 


“脚本 ”选项 卡 用 于 设置 指定 默认 脚本 语言 和 使 用 的 自动 脚本 ， 如 图 1-16 所 示 。 
1. “启用 自动 脚本 ” 复 选 框 

该 复 选 框 用 于 设置 自动 脚本 的 启用 或 禁用 ，SPSS 默认 启用 自动 脚本 。 

2. “基础 自动 脚本 ”选项 组 


用 于 指定 用 作 基 础 自动 脚本 的 脚本 文件 和 用 于 运行 脚本 的 语言 ,用 户 可 以 在 “文件 ”文本 
框 中 选择 基础 自动 脚本 文件 。 


3. “用 于 个 别 对 象 的 自动 脚本 ”选项 组 


该 选项 组 用 于 设置 对 象 应 用 的 自动 脚本 。 首 先 从 “命令 标识 ”列表 框 中 选择 一 个 命令 , 然 
后 在 “对 象 和 脚本 ”列表 框 中 选择 要 应 用 的 脚本 。 
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9 本 主 言 D): “请 过 第 半 间 二 8 委 人 用 的 汪 
Bah 一 
VW 自用 自 a 有 二 中 ) 
文件 中: Ee 0: = 
二 在 任何 其 他 自动 本 应 用 之 前 应 再 于 所有 对 条 > 
对 lO: 
JR 二 EE 
on Taole 
cas Sum 
INodel Desaipton Table 
Noles 


Panal tocorelabons 


要 将 自动 脚本 应 用 于 革 个 对 象 ， 请 先 从 "命令 标 间 列表 中 选择 命令 。 然后， 在 对象 和 网 本 阿 属 中 输入 或 选择 移 本 。 


图 1-16 “脚本 ”选项 卡 
1.3.10 ”多 重 插 补 参数 设置 
“多 重 插 补 ”选项 卡 用 于 设置 与 多 重 归 因 相 关 的 参数 ， 如 图 1-17 所 示 。 


图 1-17 “多 重 插 补 ”选项 卡 
1. “标记 插 补 数据 ”选项 组 


该 选项 组 用 于 设置 含 插 补 数据 的 单元 格 的 格式 ， 可 以 在 此 设置 单元 格 背景 色 和 单元 格 字体 。 
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2. “分 析 输 出 ”选项 组 


该 选项 组 用 于 设置 多 重 归 因 数据 集 分 析 结 果 的 浏览 器 输出 形式 , 包含 “实测 数据 及 插 补 数 
据 的 结果 ”“ 仅 实测 数据 的 结果 ”和 “ 仅 插 补 数据 的 结果 ”3 个 单 选 按 钮 和 “汇聚 结果 ”“ 诊 


断 统计 ”两 个 复 选 框 。 用 户 可 以 选择 相应 的 单 选 按钮 来 选择 归 因 数据 分 析 结 果 的 输出 形式 ， 还 
可 以 选择 当 执行 单 变量 汇聚 时 是 否 输出 汇聚 与 诊断 结果 。 


1.3.11 语法 编辑 器 参数 设置 
“语法 编辑 器 ”选项 卡 用 于 设置 语法 编辑 器 的 外 观 及 相关 参数 ， 如 图 1-18 所 示 。 


sm 国 国 国画 可 
展 汪 攻 本 声 码 「 画 全 
YY 是 未 过 证 新 色 编码 介 ) “~ 


0 
sw 国 固 国 而 辐 sm 
aasno 国 | 国 国 大 辐 -wshzssaxanwwe) 


Ai 话 三 中 改天 00 在 晤 后 一 生病 之 后 


图 1-18 “语法 编辑 器 ”选项 卡 
1. “语法 颜色 编码 ”选项 组 


在 该 选项 组 中 , 用 户 可 以 选择 是 否 显示 语法 颜色 编码 并 设置 “命令 ”“ 子 命令 ”“ 关 键 字 ” 
“ 值 ”“ 注 释 ” 及 “引号 ”的 字体 和 颜色 。 


2. “错误 颜色 编码 ”选项 组 


在 该 选项 组 中 , 用 户 可 以 选择 是 否 显示 验证 颜色 编码 , 并 设置 在 命令 与 子 命令 中 语法 错误 
的 字体 和 颜色 。 


3. “自动 补 全 设置 ”选项 组 


该 选项 组 中 的 复 选 框 用 于 设置 自动 完成 的 自动 显示 。 选中 该 复 选 框 , 表示 自动 完成 控制 时 
自动 显示 。 


4. “装订 线 ” 选 项 组 
该 选项 组 包括 “显示 行 号 ”和 “显示 命令 跨度 ”两 个 复 选 框 ， 用 于 设置 在 语法 编辑 器 的 装 
订 线 内 是 否 显示 行 号 和 命令 跨度 。 
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1.4 SPSS 24.0 运行 环境 的 设置 


SPSS 允许 用 户 自行 设置 自 定义 运行 环境 ， 用 户 可 以 对 状态 栏 、 系 统 字体 、 菜 单 和 网 格 线 
等 进行 相应 的 设置 ， 打 造 自己 的 个 性 化 界面 。 


1.4.1 SPSS 状态 栏 的 显示 和 隐藏 


在 SPSS 的 界面 中 可 自行 选择 [Baa wasn -ews sennaan -5 x 
是 否 显示 状态 栏 ， 具 体操 作 方 法 如 ”区 本 二 SD WD 9 ND DAE 
下 : 在 菜单 栏 中 依次 选择 “查看 ” 三 | A 


同 视 : 00 个 交 星 


1“ 状 态 栏 ”， 将 “状态 栏 ” 选 项 前 Ta sl | 
面 的 对 勾 去 掉 , SPSS 便 会 自动 隐藏 
状态 栏 。 如 果 用 户 在 隐藏 状态 栏 后 
希望 SPSS 再 次 显示 状态 栏 ， 只 需 
重复 上 面 的 操作 ， 让 “状态 栏 ” 选 
项 前 面 对 色 显示 即 可 , 如 图 1-19 所 
不 。 


.BM SPSS Statisics 处 理 程 序 沁 缚 | |Unicode:ON| | 


1-19 “状态 栏 ” 选 项 


隐藏 网 格 线 的 具体 操作 方法 | 
如 下 : 在 菜单 栏 中 选择 “查看 ”| 
“网 格 线 ” 命 令 ， 将 “网 格 线 ” 选 
项 前 面 的 对 勾 去 掉 ，SPSS 便 会 自 
动 隐藏 网 格 线 。 如 果 用 户 在 隐藏 网 
格 线 后 希望 SPSS 再 次 显示 网 格 
线 ， 只 需 重复 上 面 的 操作 ， 让 “网 
格 线 ”选项 前 面 的 对 勾 显 示 即 可 ， 
如 图 1-20 所 示 。 


EM SPSS Stalisics 处 理 得 序 就 线 | | [UnicodeON| | 


图 1-20 “网 格 线 ” 选 项 
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1.4.3 ”SPSS 菜单 的 增加 与 删除 


SPSS 人 允许 用 户 建立 个 性 化 的 菜单 栏 ， 用 户 可 以 根据 自己 的 需要 删除 现 有 菜单 或 增加 新 的 
菜单 ， 具 体操 作 方法 如 下 : 在 菜单 栏 中 选择 “查看 ”|“ 菜 单 编辑 器 ”命令 ， 打 开 如 图 1-21 所 
示 的 “菜单 编辑 器 ”对 话 框 。 


图 1-21 “菜单 编辑 器 ”对 话 框 
1. “应 用 于 ”下 拉 列 表 框 


该 下 拉 列 表 框 用 于 选择 要 编辑 菜单 的 窗口 ， 包 含 “数据 编辑 器 ”“ 浏 览 器 ”和 “语法 ”3 
个 选项 ， 分 别 用 于 设置 数据 编辑 器 窗口 、 输 出 窗口 和 语法 窗口 的 菜单 栏 。 


2. “菜单 ”列表 框 


该 列表 显示 了 各 个 窗口 中 菜单 栏 中 现 有 的 菜单 , 单 击 每 项 前 面 的 加 号 可 以 展开 每 项 菜单 下 
的 具体 内 容 。 当 我 们 选中 菜单 项 目 时 ， “插入 菜单 ”按钮 被 激活 ， 单 击 此 按钮 可 以 插入 新 的 菜 
单 。 此 外 双击 想 要 对 其 添加 新 项 的 菜单 或 单 击 项 目 加 号 图 标 并 选择 要 在 其 上 显示 新 项 的 菜单 
项 ，“ 插 入 项 目 ”按钮 便 被 激活 ， 单 击 此 按钮 可 插入 新 的 菜单 项 。 

3. “文件 类 型 ”选项 组 

该 选项 组 包括 “脚本 ”“ 语 法 ”和 “应 用 程序 ” 
3 个 单 选 按钮 , 用 于 为 新 项 选择 文件 类 型 。 单 击 “ 文 
件 名 ”文本 框 后 的 “浏览 ”按钮 ， 可 选择 要 附加 到 
菜单 项 的 文件 。 

此 外 , 在 菜单 项 之 间 还 可 以 添加 全 新 的 菜单 和 
分 隔 符 。 


1.4.4 ”SPSS 中 字体 的 设置 | 


SPSS 界面 中 的 字体 也 可 以 进行 设置 ， 具 体操 
作 如 下 : 在 菜单 栏 中 选择 “查看 ”|“ 字 体 ” 命 令 ， 
打开 如 图 1-22 所 示 的 “字体 ”对 话 框 。 图 1-22 “字体 ”对 话 框 
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“字体 ”对 话 框 包含 “字体 ”“ 字 型 ”和 “大 小 ”3 个 列表 框 ， 用 户 可 以 在 其 中 选择 要 定 
义 的 字形 、 字 体 样式 和 字号 ， 设 置 完 毕 后 单 击 “ 确 定 ”按钮 保存 设置 即 可 。 


1.5 ”SPSS 24.0 的 帮助 系统 
SPSS 24.0 提供 了 强大 而 完善 的 帮助 系统 , 用 户 可 以 藉 此 快速 地 适应 和 掌握 SPSS 的 操作 ， 
合理 利用 这 些 帮 助 可 方便 用 户 解决 SPSS 使 用 过 程 中 遇 到 的 疑难 问题 。 


1.5.1 联机 帮助 


在 菜单 栏 中 选择 “帮助 ”|“ 主 题 ” 命 令 ， 打 开 如 图 1-23 所 示 的 “帮助 ”窗口 。 
“帮助 ”窗口 左边 包含 “目录 ”“ 搜 索 ” 等 标签 。 使 用 “目录 ”标签 逐 级 打开 帮助 的 目录 ， 
可 获得 全 面 的 帮助 信息 ; 还 可 以 使 用 “搜索 ”标签 从 中 查找 特定 帮助 主题 以 获得 相应 的 帮助 。 


的 系统 包含 若 二 不 同 部 分 
友 (H) 
用 户 界面 上 的 信息 。 每 个 可 先 模 快 各 有 一 个 入 应 的 凶 分 
命令 语言 GPL、VizML 和 加 构 的 参考 信息 ， 命 令 语 训 的 参考 材料 还 以 PDF 形式 提供: 帮助 > 命令 语 
法 大 考 ， 
教 罗 (7) 
有 关 如 体 使 用 众多 基本 功能 的 分 步 涪 明 ， 
) 
如何 创建 各 种 类 型 的 涪 计 分 析 以 及 如 何 角 如 结果 的 实 跑 示例， 
指导 欣 完 世 吉 搁 要 合用 89 过 相 有 和 ， 
集成 必 件 
包括 Pyhon，、R、Java 和 .Net 在 内 的 每 个 编程 活 件 各 有 相 讼 的 部 分 


~ | 上 下 文 相关 帮助 
在 用 户 界 机 中 的 许多 地 方 ， 者 可 以 喜 得 上 下 文科 类 的 吕 动 。 


图 1-23 “帮助 ”窗口 


1.5.2 ”帮助 教程 


在 帮助 的 同一 级 还 有 软件 的 具体 操作 教程 ， 打 开 如 图 1-24 所 示 的 “教程 ” 窗 


DD 


Comtents ES Er EAE] 
Sm am > 
otorenee 
Era) 介绍 
站 合 Case Studies 
tO ether ht 
integration plug-in for Pyshon Haip 应 用 可 序 一 起 安装 ， 以 盆 称 可 以 如 荐 示例 来 坟 行 相同 的 分 析 ， 并 获得 与 此 处 所 示 相 同 的 结 : 
nd | 如 和 要 和 和 计 人 怕 拉 本 的 详细 示 量 ， 计 水 上 的 个 研 究 《可 从- 六 问 ) - 
integration Plog-in for Java AP1 Reference | 下 _ 责 0 
ntegration Plug i for Microsoft NET Ur 
Rw) 搓 本 文件 
打数 所 文件 
运行 村 
加 表 


1-24 “教程 ”窗口 
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“教程 ”对 话 框 给 出 了 SPSS 具体 操作 步骤 的 图 解 指导 ， 是 初学 者 快速 熟悉 SPSS 操作 的 
良好 工具 。 


1.5.3 ”各 种 对 话 框 中 的 “帮助 ”按钮 


在 使 用 SPSS 进行 信息 管理 和 统计 分 析 时 , 打开 的 各 种 主 对 话 框 和 相应 的 子 对 话 框 中 也 都 
含有 “帮助 ”按钮 ， 如 图 1-25 所 示 。 用 户 可 以 单 击 这 些 按钮 快速 输入 该 对 话 框 的 “帮助 ” 主 
题 并 获取 相应 的 帮助 。 


图 1-25 ”对话 框 右 下 方 有 “帮助 ”按钮 
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统计 数据 是 进行 数据 分 析 和 研究 的 基础 , 良好 的 数据 管理 习惯 和 建立 好 的 数据 文件 是 进行 
正确 科学 分 析 的 关键 。 数 据 文件 建立 好 之 后 ,还 需要 对 数据 进行 必要 的 整理 。 由 于 不 同 的 统计 
分 析 方 法 对 数据 结构 的 要 求 不 同 , 因此 我 们 需要 对 数据 文件 的 结构 进行 必要 的 调整 和 转换 , 这 


就 是 数据 管理 


有 E。SPSS 提供 了 强大 的 数据 管理 功能 ， 可 以 从 变量 和 观测 量 的 角度 对 数据 进行 全 


面 处 理 ， 为 统计 分 析 打 下 良好 的 基础 。 本 章 将 对 SPSS 24.0 的 数据 管理 功能 进行 介绍 。 


2.1 SPSS 24.0 数据 编辑 器 


SPSS 的 数据 编辑 器 是 用 户 进行 数据 处 理 与 分 析 的 主要 窗口 。 用 户 可 以 在 数据 编辑 器 窗口 
中 进行 数据 输入 、 观 察 、 编 辑 和 统计 分 析 等 操作 。 

在 启动 选项 中 选择 “输入 数据 ”或 “打开 现 有 的 数据 源 ”， 进 入 SPSS 后 的 第 一 个 窗口 就 
是 数据 编辑 窗口 ， 如 图 2-1 所 示 。 


蛤 无 标题 1 [数据 告 0] - IBM SPSS Statistics 数据 汽 扣 器 


TE 


数据 和 单元 格 信息 显示 栏 


1BM SPSS Statistics 外 里程 序 后 


图 2-1 数据 编辑 窗口 


1. 标题 栏 


显示 窗口 名 称 和 编辑 的 数据 文件 名 。 如果 当 前 数据 编辑 器 中 是 一 个 新 建 的 文件 , 其 显示 为 
“未 标题 1[ 数 据 集 0]- IBM SPSS Statistics 数据 编辑 器 ”。 
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2. 菜单 栏 


菜单 栏 包括 “文件 ” “编辑 ”“ 查 看 ”“ 数 据 ”“ 转 换 ”“ 分 析 ”“ 直 销 ”“ 图 形 ”“ 实 
用 程序 ”“ 扩 展 ”“ 窗 口 ”和 “帮助 ”菜单 ， 这 些 菜单 可 以 实现 编辑 数据 与 变量 、 定 义 系统 参 
数 、 设 置 显示 方式 、 绘 制图 形 、 进 行 各 项 数据 分 析 和 查阅 帮助 等 功能 。 

3. 数据 和 单元 格 信息 显示 栏 

该 显示 栏 用 于 显示 单元 格 位 置 和 单元 格 的 内 容 等 相关 信息 .灰色 区 域 为 提示 区 , 显示 单元 
格 的 位 置 ， 空 特区 域 为 数据 编辑 区 ， 该 区 域内 显示 当前 选中 单元 格 的 内 容 ,用户 可 以 在 该 区 域 
输入 或 修改 相应 的 内 容 。 

4. 编辑 显示 区 

在 窗口 的 中 部 是 编辑 显示 区 ,该 区 最 左边 一 列 显示 单元 序列 号 ,最 上 边 一 行 显示 变量 名 称 。 
选 定 的 单元 格 旦 反 色 显示 ,其 内 容 将 出 现在 数据 和 单元 格 信息 显示 栏 中 ,在 此 输入 或 修改 单元 
格 内 容 。 

5. 视图 转换 栏 

该 栏 用 于 进行 变量 和 数据 视图 的 切换 ,用 户 只 需要 单 击 相应 的 标签 便 可 以 完成 变量 与 数据 
视图 的 切换 。 

6. 系统 状态 栏 

该 栏 显示 当前 的 系统 操作 ， 用 户 可 以 通过 该 栏 了 解 SPSS 当前 的 工作 状态 。 


2.2 常量、 变量 、 操 作 符 和 表达 式 


常量 、 变 量 、 操 作 符 和 表达 式 是 SPSS 数据 管理 与 操作 中 的 基本 概念 ， 也 是 SPSS 命令 语 
句 的 重要 组 成 部 分 。 


2.2.1 SPSS 中 的 常量 与 变量 


1. 常量 


SPSS 中 的 常量 是 在 一 定 阶段 内 其 取 值 不 随 观测 而 改变 的 值 。SPSS 中 的 常量 有 3 种 类 型 ， 
即 数值 型 常量 、 字 符 型 常量 和 日 期 型 常量 。 


e 数值 型 常量 : 数值 型 常量 是 一 个 数值 . 数值 型 常量 有 两 种 书写 方式 , 一 是 普通 书写 方式 ( 定 
点 方式 ) ， 如 53、74.2 等 ; 二 是 科学 计数 法 ( 浮 点 方式 ) ， 使 用 指数 表示 数值 ， 通 常用 
于 表示 特别 大 或 特别 小 的 数值 ， 如 3.16E18 表示 3.16 x 1018、7.32E-15 表示 7.32 x 1035 等 。 
。 字符 型 常量 : 字符 型 常量 是 被 单 引号 或 双 引 号 括 起 来 的 一 串 字 符 。 如 果 字 符 串 中 本 身 带 有 单 
引号 或 半 个 单 引号 ， 则 该 字符 串 常 量 必须 使 用 双 引 号 括 起 来 ， 如 字符 串 SPSS、This is Tom。 
e 日 期 型 常量 : 日 期 型 常量 是 按 特 定格 式 输出 的 日 期 ， 日 期 型 常量 一 般 使 用 较 少 。 
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2. 变量 


对 不 同 的 对 象 其 取 值 发 生变 化 的 量 称 为 变量 。SPSS 中 的 变量 也 包括 数值 型 变量 、 字 符 型 
变量 和 日 期 型 变量 3 种 。 


(1) 数值 型 变量 
数值 型 变量 一 般 由 数字 、 分 隔 符 和 一 些 特殊 符号 (如 美元 符号 ) 构成 ,数值 型 变量 包含 以 
下 6 种 具体 的 形式 。 


@ 标准 型 。 标 准 数值 型 变量 是 SPSS 中 默认 的 数值 变量 格式 。 其 默认 长 度 为 8， 小 数位 数 
为 2， 小数 采 用 圆 点 表示 。 标 准 数值 型 变量 的 变量 值 可 用 标准 数值 格式 输入 ， 也 可 以 用 科学 记 
数 法 输入 ， 如 2378、44.21 等 。 

@) 逗号 数值 型 。 喜 号 数值 型 变量 的 整数 部 分 从 右 向 左 每 隔 三 位 插入 一 个 逗号 作为 分 隔 。 
逗号 数值 型 变量 默认 长 度 为 8， 小 数位 数 为 2， 小 数 点 采用 圆 点 表示 ， 如 7 467.55。 

@ 圆 点 数值 型 。 圆 点 数值 型 变量 显示 方式 与 带 逗 号 的 数值 型 变量 相反 ， 其 整数 部 分 从 右 
向 左 每 隔 三 位 插入 一 个 圆 点 作为 分 隔 符 ， 默 认 长 度 为 8， 小 数位 数 为 2， 小 数 点 采用 逗号 表示 ， 
如 7.467 55。 

@ 科学 计数 法 型 。 科 学 计数 法 型 数值 变量 的 数值 采用 指数 形式 表示 。 科 学 计数 法 型 数值 
变量 默认 长 度 为 8， 小 数位 数 为 2， 通 常用 于 表示 很 大 或 很 小 的 数字 ， 如 3.43E+002 表示 
3.43*10”。 

@ 美元 型 。 美 元 型 数值 型 变量 是 在 有 效 数 字 前 添加 美元 符号 的 数值 型 变量 ， 默 认 长 度 为 
8， 小 数位 数 为 2， 系 统 给 出 了 美元 型 变量 的 多 种 表示 形式 ， 用 户 可 以 根据 需要 自行 选择 相应 
的 形式 ， 如 $56 434.277。 

自 定义 货币 型 。 用 户 也 可 以 创建 5 种 自 定义 数 据 显示 格式 ， 系 统 自动 将 自 定义 数据 显 
示 名 称 命名 为 CCA、CCB、CCC、CCD 和 CCE， 这 只 是 5 种 命名 ， 用 户 可 以 自行 定制 这 5 种 
类 型 。 

(2) 字符 型 变量 

字符 型 变量 由 字符 串 组 成 ， 可 以 包含 数字 、 字 母 和 一 些 特殊 符号 。 字 符 型 变量 的 默认 长 度 
为 8， 大 于 8 个 字符 的 字符 型 变量 称 为 长 字符 型 变量 ， 少 于 等 于 8 个 字符 的 变量 称 为 短 字符 型 


变量 ， 字 符 型 变量 最 长 为 32767 个 字符 。 字 符 型 变 sas < 
量 不 能 参与 运算 ， 系 统 将 区 分 大 小 写字 母 。 a 
(3 ) 日 期 型 变量 Ge me 
日 期 型 变量 用 于 表示 日 期 和 时 间 。 在 如 图 2-2 Setse Gann 
所 示 的 “变量 类 型 ”对 话 框 中 ， 选 中 “日 期 ” 单 选 gru mmm 
按钮 , 可 以 看 到 SPSS 提供 的 29 种 不 同 的 日 期 和 时 2 于 Wod 
间 格 式 .可 根据 需要 选择 相应 的 格式 , 如 1-12-2009、 o> (和 RS) 加 |aG mr 


29.12.99 等 。 日 期 型 变量 不 能 参与 运算 ， 要 想 使 用 。 @) ** 和 owns, mn hn， 
日 期 变量 的 值 进行 运算 ， 必 须 通 过 有 关 的 日 期 函数 TT 
进行 转换 。 


2-2 日 期 型 变量 的 格式 
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2.2.2 ”变量 名 与 变量 标签 


变量 名 和 变量 标签 是 用 户 识别 变量 的 标志 , 定义 良好 的 变量 名 和 变量 标签 将 有 助 于 提高 分 
析 的 效率 。 

1. 变量 名 

变量 名 用 于 区 分 不 同 的 变量 ，SPSS 中 变量 的 命名 规则 如 下 。 

Q@ SPSS 变量 的 变量 名 不 能 超过 64 个 字符 。 

@ 首 字符 必须 是 字母 、 中 文 或 特殊 符号 “@”“$” 或 “#”。 

@ 变量 名 中 不 能 出 现 “? ”“! ”“-”“+”“=”“*” 和 空格 。 

@ 末 字 符 不 能 为 “.” 和 “_”。 

@ 名 称 不 能 与 SPSS 的 保留 字 相 同 ，SPSS 的 保留 字 有 AND、BY、EQ、GE、GT、LT、 
NE、NOT、OR、TO、WITH 和 ALL。 

@ 系统 不 区 分 变量 名 中 的 大 小 写字 母 。 

2. 变量 标签 

变量 标签 是 对 变量 名 和 变量 值 的 辅助 说 明 ， 包 括 变量 名 标签 和 变量 值 标签 两 类 。 

(1) 变量 名 标签 

变量 名 标签 是 对 变量 名 的 进一步 解释 和 说 明 。 变 量 名 标签 可 由 不 超过 256 个 字符 的 数字 、 
汉字 、 字 母 和 特殊 符号 构成 ， 可 以 包含 空格 和 SPSS 保留 字 。 用 户 可 以 自行 设置 变量 名 标签 和 
变量 名 的 显示 方式 ,也 可 以 用 变量 名 标签 代替 变量 名 显示 。 变 量 名 标签 是 一 个 可 选择 属性 , 用 
户 可 以 不 定义 变量 名 标签 。 

(2) 变量 值 标签 

变量 值 标签 是 对 变量 取 值 的 进一步 解释 和 说 明 , 通常 用 于 分 类 变量 。 变量 值 标签 最 大 长 度 
为 120 个 字符 ， 其 只 对 数值 型 变量 、 日 期 型 变量 和 短 字 符 型 变量 有 效 ， 变 量 值 标签 是 一 个 可 选 
择 属 性 ， 可 不 定义 变量 的 值 标签 。 


2.2.3 ”运算 符 与 表达 式 


SPSS 的 基本 运算 有 3 种 ， 即 数学 运算 、 关 系 运 算 和 风 辑 运算 ， 相 应 的 运算 符 及 其 意义 如 
表 2-1 所 示 。 


表 2-1 SPSS 中 的 运算 符 


数学 运 关系 运算 符 
意义 符号 

十 LT 小 于 AND 与 
GT 天 狠 OR 或 
LE 小 于 或 等 于 NOT 

/ GE 

"+ | 着 方 “|= EQ 等 

0 | 括号 一 NT 
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将 常量 变量 或 函数 用 运算 符 进 行 连 接 ， 便 形成 了 表达 式 ， 表 达 式 的 具体 形式 有 以 下 3 种 。 

1. 算数 表达 式 

数学 运算 符 连 接 数 值 型 的 常量 、 变 量 和 函数 即 形成 算数 表达 式 ， 其 运算 结果 一 般 为 数值 ， 
如 表达 式 23+45， 输 出 结果 为 68。 

2. 比较 表达 式 


利用 关系 运算 符 建 立 两 个 变量 间 的 比较 关系 即 为 比较 表达 式 。 比 较 表 达 式 要 求 相互 比较 的 
两 个 量 类 型 一 致 ， 比 较 表 达 式 的 结果 一 般 为 逻辑 型 ， 例 如 ，x=2， 则 表达 式 “x>0” 为 真 ， 系 
统 返 回 1 (tue) 。 

3. 逻辑 表达 式 

逻辑 表达 式 由 逻辑 运算 符 、 逻 辑 型 的 变量 或 取 值 为 逻辑 型 的 比较 表达 式 构成 , 逻辑 表达 式 
的 值 为 逻辑 型 常量 ， 例 如 ， 对 于 表达 式 “true AND true” 系 统 返回 true，“true OR false” 系 统 
返回 true。 


2.2.4 ”变量 的 定义 


在 图 2-1 所 示 的 数据 编辑 窗口 中 的 视图 转换 栏 中 选择 “变量 视图 ”标签 ， 即 输入 如 图 2-3 
所 示 的 变量 视图 。 变 量 的 定义 就 是 在 数据 编辑 器 的 变量 视图 中 进行 的 。 


5 (el 6M SPSS Siatiotics SR Er 


[ BM SPSS Staistics 外 还 程 序 寺 者 。 |unicode ON | 


图 2-3 数据 编辑 器 的 变量 视图 
1. 定义 变量 名 
选中 某 个 变量 的 “名 称 ”单元 格 ， 直接 输入 变量 名 便 可 定义 变量 名 称 , 输入 完成 后 单 击 其 
他 单元 格 或 按 回 车 键 即 完成 设置 .如 果 用 户 没有 预先 设置 变量 名 称 而 直接 在 数据 视图 中 输入 数 


据 ， 那 么 变量 名 称 将 使 用 系统 的 默认 名 称 VAR00001、VAR00002 等 ,用 户 可 以 双击 变量 名 称 
输入 变量 视图 修改 变量 名 称 。 
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2. 定义 变量 类 型 em x 
选中 某 个 变量 的 “类 型 ”单元 格 , 单 击 国 按钮 oo 区 
弹出 如 图 2-4 所 示 的 “变量 类 型 ”对 话 框 。 a J 位 才 )， [2 


用 户 在 该 对 话 框 中 选择 相应 的 单 选 按钮 即 可 | om 
完成 变量 类 型 的 选择 ,具体 的 变量 类 型 及 其 含义 在 | 3 本 Wu 
2.2.1 节 已 经 进行 了 详细 说 明 ， 在 此 不 再 资 述 。 = 


口 将 数字 (这 有 前 与 等 的 整 雪 ) (E) 


3. 宽度 定义 @ YT RT 
选中 某 个 变量 的 “宽度 ”单元 格 ， 直 接 输入 相 国 国画 
应 的 数值 便 可 定义 变量 宽度 ， 可 以 通过 悦 按钮 来 调 - 
节 变量 的 宽度 ， 系 统 默认 的 变量 宽度 为 8。 变 量 宽 图 24 “变量 类 型 ”对 话 杠 
度 的 设置 对 日 期 型 变量 无 效 。 
4. 小 数位 数 定义 


选中 某 个 变量 的 “小 数 ”单元 格 ， 直 接 输入 相应 的 数值 便 可 定义 变量 的 小 数位 数 ， 也 可 以 
通过 强 按 钮 来 调节 变量 的 小 数位 数 ， 系 统 默认 的 小 数位 数 为 2。 变量 小 数位 数 的 设置 对 非 数值 
型 变量 无 效 。 

5. 变量 标签 定义 

选中 某 个 变量 的 “标签 ”单元 格 ， 直 接 输 入 相应 的 内 容 便 可 定义 该 变量 标签 。 

6. 变量 值 标签 定义 


选中 某 个 变量 的 “ 值 ” 单 元 格 ， 单 击 图 按钮 弹出 如 图 2-5 所 示 的 “ 值 标签 ”对 话 框 。 

“ 值 ” 文本 框 用 于 输入 要 定义 标签 的 变量 值 , 在 “标签 ”文本 框 中 输入 定义 的 值 标签 内 容 ， 
输入 完成 后 单 击 “ 添 加 ”按钮 使 设置 好 的 值 标签 输入 下 方 的 列表 框 。 单 击 “ 更 改 ” 和 “删除 ” 
按钮 可 修改 或 删除 设置 好 的 值 标签 。 


7. 缺失 值 的 定义 


选中 某 个 变量 的 “缺失 ”单元 格 ， 单 击 国 按 钮 弹出 如 图 2-6 所 示 的 “缺失 值 ” 对 话 框 。 
有 3 个 可 定义 单 选 按 钮 。 


配售 5 和 x 
RE ETTT 
IE | ompakmO 
[aa 名 范围 加 上 一 个 可 选 的 高 散 抽 失 值 (R) 
[| 下 限 (U): 上 限 (H: 
Le 离散 值 (S): 
EEE ESEAIED 
图 2-5 “ 值 标签 ”对 话 框 2-6 “缺失 值 ”对 话 框 


23 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


。 无 缺失 值 : 表示 无 缺失 值 ， 为 系统 默认 方式 。 

。 离散 缺失 值 : 表示 数据 中 存在 离散 缺失 值 ， 用 户 可 以 在 其 下 的 文本 框 中 输入 不 超过 3 个 的 
缺失 值 。 

。 范围 加 上 一 个 可 选 的 离散 缺失 值 : 表示 数据 中 存在 连续 缺失 值 ， 在 “下 限 ” 和 “上 限 ” 文 
本 框 中 输入 相应 的 值 以 确定 缺失 值 的 取 值 范围 。 此 外 ， 用 户 还 可 以 在 “离散 值 ”文本 框 中 
指定 一 个 离散 形式 的 缺失 值 。 

8. 列 显示 宽度 设置 


选中 某 个 变量 的 “ 列 ” 单元 格 ， 直 接 输入 相应 数值 便 可 定义 列 的 显示 宽度 ， 可 以 通过 弹 按 
钮 来 调节 列 的 显示 宽度 。 


9. 对 齐 方 式 设置 

选中 某 个 变量 的 “对 齐 ” 单 元 格 ， 在 其 右 侧 出 现 的 下 拉 列 表 中 选择 相应 的 对 齐 方 式 即 可 ， 
系统 给 出 了 “ 左 ”“ 右 ”和 “居中 ”3 种 对 齐 方式 。 

10. 变量 度量 尺度 设置 


选中 某 个 变量 的 “度量 方式 ”单元 格 , 在 其 右 侧 出 现 的 下 拉 列 表 框 中 选择 相应 的 度量 尺度 
即 可 。 


2.3 输入 数据 


数据 输入 是 数据 管理 中 的 基本 操作 , 本 节 将 对 数据 输入 的 方法 和 文件 与 变量 信息 的 查看 进 
行 相应 的 介绍 。 


2.3.1 输入 数据 的 方法 


变量 定义 完成 后 , 在 如 图 2-1 所 示 的 数据 编辑 窗口 的 视图 转换 栏 中 选择 “数据 视图 ”标签 ， 
输入 数据 视图 ， 即 可 在 SPSS 的 数据 管理 器 的 编辑 显示 区 中 直接 输入 和 编辑 数据 。 编 辑 显示 区 
是 一 个 电子 表格 ,其 每 一 行 代表 一 个 观测 ,每 一 列 代 表 一 个 变量 ,行列 交叉 处 称 为 单元 格 ， 单 
元 格 中 给 出 观测 在 相应 特性 上 的 取 值 。 单 击 鼠 标 左 键 可 激活 单元 格 , 被 激活 的 单元 格 以 反 色 显 
示 ; 按 方 向 键 上 下 左右 移动 也 可 以 来 激活 单元 格 , 单元 格 被 激活 后 ， 用户 即 可 向 其 中 输入 新 数 
据 或 修改 已 有 的 数据 。 


2.3.2 ”文件 和 变量 信息 的 查看 


数据 文件 建立 后 ,我 们 可 能 希望 看 到 数据 文件 的 结构 和 变量 的 组 成 以 确定 是 否 需要 完善 或 
修改 ， 此 时 我 们 就 需要 用 到 文件 和 变量 信息 查看 功能 。 


1. 查看 变量 信息 
(1) 在 结果 输出 窗口 中 查看 变量 信息 
在 菜单 栏 中 选择 “文件 ”|“ 显 示 数 据 文件 信息 ”|“ 工 作文 件 ” 命 令 ， 就 可 以 将 当前 工作 
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文件 的 变量 信息 输出 到 结果 查看 窗口 ， 输 出 结果 如 图 2-7 所 示 ; 此 外 ,用 户 还 可 以 在 菜单 栏 中 
选择 “文件 ” |“ 显示 数据 文件 信息 ”|“ 外 部 文件 ”命令 并 选择 相应 的 外 部 文件 ， 将 其 他 工作 
文件 的 变量 信息 输出 到 结果 查看 窗口 。 


变 最 信息 
Cr ET EE 
Property ID 
2 | Township 
Assessor 
Sale value of 


Value atlast 


appraisal 
Years since 
last appraisal 


工作 文件 中 的 变量 


图 2-7 结果 输出 窗口 中 输出 的 变量 信息 
(2) 利用 工具 栏 查看 变量 信息 
在 菜单 栏 中 选择 “实用 程序 ” |“ 变量” 命令 ， 打 开 如 图 2-8 所 示 的 “变量 ”对 话 框 。 
在 “变量 ”列表 框 中 选中 相应 的 变量 ， 即 可 查看 当前 数据 文件 中 的 变量 信息 ， 信 息 显 示 在 
右 侧 文本 框 中 。 
2. 查看 文件 信息 


在 菜单 栏 中 选择 “文件 ” |“ 显示 数据 文件 信息 ”|“ 外 部 文件 ”命令 并 选择 相应 的 外 部 文 
件 ， 可 以 将 相应 工作 文件 的 文件 信息 输出 到 结果 查看 窗口 ， 输 出 结果 如 图 2-9 所 示 。 


DR ae 


ET SPSS Stvates RH 
枉 四 31.0cT2017023937 
属 信息 - 天 
| propid UTF8 
力 电 Township town] Nr pe 个 案 
国人 DAssessorlassess. 天 
图 Sale value ofhous. Sa 四 无 
园 4p Value atlastappra__ | 可 是 织 别 ”度量 天 
加 bp veassncelasta | as 3 
Wn DR 下 
TenSman 信 8 + 
是 要 器 信 息 5 
茹 信息 。 个 大 数 图 
定义 的 变 芝 元 素数 12 
重信 的 变 妆 几 0 
3 是 
2-8 “变量 ”对 话 框 图 2-9 文件 信息 


2.4 编辑 数据 


在 输入 数据 后 ， 我 们 需要 对 数据 进行 相应 的 整理 或 编辑 ，SPSS 提供 了 强大 的 数据 编辑 功 
能 ， 可 以 实现 数据 的 修改 、 删 除 、 复 制 和 插入 等 操作 。 
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2.4.1 ”插入 和 删除 观测 量 

有 时 我 们 需要 对 数据 进行 相应 的 修改 。 例 如， 公司 新 进 了 一 名 员工 , 需要 将 他 的 信息 插入 
原 有 的 数据 库 ,此 时 我 们 需要 进行 变量 的 插入 操作 ; 一 名 学 生 退 学 ， 则 需要 从 班级 名 单 中 将 其 
删除 ， 此 时 我 们 需要 进行 变量 的 删除 操作 。 

1. 插入 观测 量 

用 户 可 以 通过 菜单 命令 插入 变量 , 也 可 以 通过 工具 栏 和 鼠标 右键 快捷 菜单 插入 观测 量 , 这 
几 种 方法 是 等 价 的 。 

(1) 在 SPSS 数据 编辑 器 的 数据 视图 下 ， 将 任 一 观测 量 所 在 行 的 任意 单元 格 激活 ， 然 后 
选择 “编辑 ”|“ 插 入 个 案 ” 命 令 ， 即 可 完成 观测 量 插入 操作 。 

(2) 在 SPSS 数据 编辑 器 的 数据 视图 下 ， 将 鼠标 移动 到 相应 的 观测 量 序号 上 并 单 击 选中 
该 观测 量 ， 此 时 该 观测 量 所 在 行 的 所 有 单元 格 都 被 选中 并 呈 反 色 显 示 , 单 击 鼠 标 右键 , 在 弹出 
的 快捷 菜单 中 选择 “插入 个 案 ” 命 令 ， 即 可 完成 变 观 测量 插入 操作 。 

(3) 在 SPSS 数据 编辑 器 的 数据 视图 下 ， 将 任 一 观测 量 所 在 行 的 任意 单元 格 激活 ， 然 后 
单 击 工具 栏 上 的 忆 按 钮 ， 也 可 以 完成 观测 量 插入 操作 。 


2. 删除 观测 量 
删除 变量 将 删除 该 观测 量 所 在 行 的 全 部 数据 ， 删 除 观测 量 有 两 种 等 价 的 方法 。 


(1) 在 SPSS 数据 编辑 器 的 数据 视图 下 ， 将 鼠标 移动 到 相应 的 观测 量 序号 上 并 单 击 选 中 
该 观测 量 ， 此 时 该 观测 量 所 在 列 的 所 有 单元 格 都 被 选中 并 呈 反 色 显示 ,然后 选择 “编辑 ”|“ 清 
除 ” 命 令 ， 即 可 完成 观测 量 的 删除 操作 。 

(2) 同样 通过 观测 量 序号 选中 该 观测 量 ， 然 后 右 击 并 在 弹出 的 快捷 菜单 中 选择 “清除 ” 
命令 ， 即 可 完成 观测 量 的 删除 操作 。 
2.4.2 ”数据 的 剪 切 、 复 制 和 粘贴 


对 数据 进行 剪 切 、 复 制 和 粘贴 操作 前 ， 首 先 选 中 需要 操作 的 数据 区 域 ， 被 选中 的 数据 区 域 
反 色 显示 。 


1. 数据 的 剪 切 


选中 需要 操作 的 数据 区 域 后 ， 在 菜单 栏 中 选择 “编辑 ”|“ 剪 切 ”命令 ， 或 者 单 击 鼠标 右 
键 在 弹出 的 快捷 菜单 中 选择 “ 剪 切 ”命令 ， 均 可 完成 数据 的 剪 切 操作 。 


2. 数据 的 复制 


选中 需要 操作 的 数据 区 域 后 ， 在 菜单 栏 中 选择 “编辑 ” |“ 复制” 命令 ， 或 者 单 击 鼠标 右 
键 在 弹出 的 快捷 菜单 中 选择 “复制 ”命令 ， 均 可 完成 数据 的 复制 操作 。 


3. 数据 的 粘贴 
选中 需要 操作 的 数据 区 域 后 ， 在 菜单 栏 中 选择 “编辑 ”|“ 粘 贴 ”命令 ， 或 者 单 击 鼠标 右 
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键 在 弹出 的 快捷 菜单 中 选择 “粘贴 ”命令 ， 均 可 完成 数据 的 粘贴 操作 。 
此 外 ， 用 户 还 可 以 通过 CttHHX、CtrlHC 和 CtrlHV 组 合 键 分 别 来 实现 数据 的 剪 切 、 复 制 和 
粘贴 操作 。 


2.4.3 ”撤销 操作 


当 用 户 对 数据 进行 了 错误 操作 并 希望 返回 操作 前 的 状态 时 ， 可 以 在 菜单 栏 中 选择 “编辑 ” 
|“ 撤销” 命令 ,或 者 在 工具 栏 上 单 击 大 按钮 来 执行 撤销 任务 。 


2.5 数据 文件 操作 


当 输 入 数据 建立 数据 文件 后 ， 根 据 统计 分 析 的 要 求 我 们 可 能 需要 对 数据 进行 分 类 等 处 理 ， 
或 者 对 数据 文件 进行 相应 的 转换 。 对 数据 文件 的 正确 操作 对 于 准确 地 进行 分 析 具 有 重要 的 意义 。 


2.5.1 数据 文件 的 打开 与 保存 


要 进行 数据 分 析 ， 必 须 先 打开 一 个 数据 文件 ,数据 文件 的 打开 是 进行 数据 分 析 的 前 提 ; 在 
分 析 结 束 后 ， 如 果 需 要 保存 分 析 的 结果 ， 此 时 将 会 用 到 数据 文件 的 保存 功能 。 


1. 打开 数据 文件 
打开 数据 文件 的 具体 操作 步骤 如 下 


人 EXOi) 在 菜单 栏 中 选择 “文件 ”| “打开”| “数据 ”命令 ， 或 者 单 击 工具 栏 上 的 区 按钮 ， 打 
开 如 图 2-10 所 示 的 “打开 数据 ”对 话 框 。 


本 es x 


图 2-10 “打开 数据 ”对 话 框 

(EI02 选择 相应 的 文件 。 如 果 需 要 打开 其 他 数据 文件 ， 用 户 可 以 在 “文件 类 型 ”下 拉 列表 
框 中 选择 相应 的 类 型 。 关 于 数据 文件 的 转换 本 书后 面 章节 会 做 详细 介绍 ， 这 里 不 做 
深 述 。 

人 E703 双击 需要 打开 的 文件 或 单 击 “ 打 开 ” 按 钮 即 可 打开 文件 。 从 SPSS 15.0 开始 ， 系 统 支 
持 同时 打开 多 个 数据 文件 ， 这 极 大 地 方便 了 用 户 在 不 同 的 数据 文件 之 间 进 行 操作 。 
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2. 保存 数据 文件 


在 菜单 栏 中 选择 “文件 ” |“ 保存” 命令 ， 或 者 选择 “文件 ”| “另存 为 ”命令 ， 或 者 在 工 
具 栏 中 单 击 周 按 钮 都 可 实现 数据 文件 的 保存 操作 。 

如 果 用 户 保 存 的 是 新 建 的 数据 文件 ， 当 进行 以 上 操作 时 ， 会 弹出 如 图 2-11 所 示 的 “将 数 
据 保存 为 ”对 话 框 。 

用 户 可 以 保存 所 有 的 变量 ， 也 可 以 单 击 “ 变 量 ”按钮 ， 在 弹出 的 “数据 保存 为 : 变量 ”对 
话 框 ( 如 图 2-12 所 示 ) 中 只 选择 要 保存 的 变量 。 


[EC 蕊 
内 已 县 保存 到 下 的 所 叉 件 中 
21 a 名 称 。 | 标签 。 | 鸯 序 


I 


已 造 : 3 个 变量 ' 共 3 个 变量 : 


EEC 
图 2-11 “将 数据 保存 为 ”对 话 框 图 2-12 “数据 保存 为 : 变量 ”对 话 框 


除 保存 为 SPSS 数据 文件 外 , 数据 文件 还 可 以 用 其 他 的 数据 格式 保存 , 在 “将 数据 保存 为 ” 
对 话 框 的 “保存 类 型 ”下 拉 列 表 框 中 选择 数据 文件 的 保存 类 型 即 可 。 


2.5.2 ”数据 排序 


杂乱 的 数据 显然 不 利于 分 析 效 率 的 提升 ， 有 时 我 们 希望 观测 量 能 按照 某 一 个 顺序 进行 排 
列 ， 例 如 我 们 在 评比 时 希望 按 绩效 的 高 低 对 员工 进行 排序 ， 此 时 将 用 到 数据 排序 的 功能 。 

本 节 将 以 职工 平均 工资 分 析 案 例 讲解 数据 排序 的 具体 操作 。 本 例 中 , 我 们 希望 了 解 不 同 地 
区 职工 的 平均 工资 〈 单 位: 元 ) 情况 ， 利 用 数据 排序 功能 对 不 同 地 区 职工 平均 工资 进行 排序 。 
排序 前 的 数据 文件 如 图 2-13 所 示 。 


四 sige so 1] -BM SP55 Stanticy ms 所 于 下 
HO ME) EW MRO) WMD HW BNW EG) XNARU) FR BOW NH) 


EE El 


图 2-13 进行 数据 排序 前 的 工资 数据 文件 
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排序 前 的 数据 文件 中 观测 量 的 排列 是 混乱 的 ,我 们 无 法 从 中 看 出 不 同 地 区 职工 平均 工资 的 
高 低 和 某 一 个 地 区 职工 平均 工资 在 全 国 所 处 的 位 置 。 
下 面 对 工 资 数据 进行 排序 ， 具 体操 作 步骤 如 下 : 
人 EX) 在 菜单 栏 中 选择 “数据 ”| “个案 排序 ”命令 ， 打 
开 如 图 2-14 所 示 的 “个 案 排 序 ” 对 话 框 。 
(EI02 选择 排序 依据 变量 ， 然 后 单 击 国 按 钮 将 选中 的 变 
量 选 入 “排序 依据 ”列表 框 中 ， 系 统 允 许 选择 多 
个 变量 ， 在 第 一 变量 取 值 相同 的 情况 下 比较 第 二 
变量 ， 依 次 类 推 。 本 例 中 我 们 将 对 不 同 地 区 的 职 
工 工资 进行 排序 , 故 将 “平均 工资 "变量 选 入 “ 排 
序 依据 ”列表 框 。 图 2-14 “个 案 排序 ”对 话 框 
(ZI03 在 “排列 顺序 ”选项 组 中 选择 按 “升序 ”或 “降序 ”排列 ， 本 例 中 ， 我 们 希望 按 昭 
由 高 到 低 的 顺序 进行 排列 ， 故 选中 “降序 ” 单 选 按钮 。 
(04 单 击 “ 确 定 ” 按 钮 ， 即 可 完成 排序 操作 。 


排序 完成 后 的 工资 数据 文件 如 图 2-15 所 示 。 


| 办 "sv 数量 11- 旧 M spS5 Statistics 政 更 六 研 加 - D x 


2-15 进行 数据 排序 后 的 工资 数据 文件 


由 图 2-15 我 们 可 以 看 出 ， 观 测量 已 经 按照 平均 工资 的 降序 进行 了 排列 ， 通 过 数据 排序 可 
以 看 出 西藏 、 青 海 等 艰苦 地 区 与 北京 、 上 海 等 经 济 发 达 地 区 属于 平均 工资 较 高 的 地 区 ， 此 外 我 
们 也 可 以 看 出 各 省 市 在 平均 工资 排序 中 的 大 致 位 置 。 


2.5.3 ”数据 文件 的 分 解 与 合并 


有 时 我 们 需要 将 变量 按照 指定 的 要 求 进行 分 组 , 例如 按照 地 区 分 析 销 售 人 员 的 业绩 , 此 时 
要 用 到 数据 的 分 解 功能 ; 有 时 我 们 需要 将 不 同 的 数据 文件 组 合 形成 一 个 新 的 数据 文件 , 例如 要 
将 二 班 的 成 绩 和 一 班 的 成 绩 放 在 一 起 形成 总 成 绩 表 ,或 者 把 生物 成 绩 追 加 到 数学 和 物理 成 绩 之 
后 ， 此 时 我 们 将 用 到 数据 的 合并 功能 。 
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1. 数据 文件 的 分 解 


所 谓 数据 文件 的 分 解 ,是 指 将 该 数据 文件 中 的 所 有 观测 量 以 某 一 个 或 某 几 个 变量 为 关键 字 
进行 分 组 ,以 便于 集中 对 比 和 操作 。 本 节 将 以 销售 人 员 的 业绩 分 析 为 例 讲解 数据 文件 的 分 解 操 
作 ， 本 例 中 我 们 希望 按照 地 区 划分 销售 人 员 的 业绩 ， 以 分 析 不 同 地 区 的 销售 情况 。 分 解 前 的 数 
据 文件 如 图 2-16 所 示 。 


图 2-16 分 解 前 的 销售 业绩 数据 文件 (销售 量 单位 :万 件 ) 
通过 图 2-16 我 们 可 以 看 出 ， 数 据 文件 是 按照 销售 量 进 行 的 排序 ， 对 各 分 区 的 业绩 考核 与 


排序 则 不 够 直观 。 
数据 分 解 的 具体 操作 步骤 如 下 : 
I01 在 菜单 栏 中 选择 “数据 ”|“ 拆 分 文件 ”命令 ,打开 如 图 2-17 所 示 的 “ 拆 分 文件 ”对 
话 框 。 


CET02 选择 文件 分 解 方式 。 如 选中 “分 析 所 有 个 案 ， 不 创建 组 ” 单 选 按钮 ， 系 统 将 不 进行 
分 组 操作 ， 如 选中 “比较 组 ” 单 选 按钮 ， 系 统 将 把 各 组 的 分 析 结果 放 在 同一 个 表格 
中 比较 输出 ， 如 选中 “ 按 组 来 组 织 输出 ” 单 选 按钮 ， 系 统 将 按 分 组 单独 输出 分 析 结 
果 。 本 例 选 中 “ 按 组 来 组 织 输出 ” 单 选 按钮 。 
E03 选择 分 组 方式 与 显示 方式 。 选 中 “比较 组 ”或 “ 按 组 来 组 织 输出 ” 单 选 按钮 ， 分 组 
方式 列表 和 设置 文件 排序 方式 的 两 个 单 选 按钮 将 被 激活 。 在 列表 中 选择 排序 依据 变 
量 ， 然 后 单 击 国 按 钮 将 选中 的 变量 选 入 “分 组 依据 ”列表 框 中 。 本 例 将 按照 地 区 进 
行销 售 业绩 的 评估 ， 故 选择 “地 区 ”变量 输入 “分 组 依据 ”列表 框 。 
04 选择 排序 方式 。 如 选中 “ 按 分 组 变量 进行 文件 排序 ” 单 选 按钮 ， 系 统 会 将 观测 量 按 
分 组 文件 的 顺序 进行 排列 ， 如 选中 “文件 已 排序 ” 单 选 按钮 ， 则 表示 文件 已 经 排序 ， 
无 须 系统 进行 排序 操作 。 本 例 中 的 数据 文件 未 按 “ 地 区 ”变量 进行 分 组 , 故 选中 “ 按 
分 组 变量 进行 文件 排序 ” 单 选 按钮。 
(I05 单 击 “确定 ”按钮 ， 即 可 进行 文件 分 解 操 作 。 分 解 完成 的 数据 文件 如 图 2-18 所 示 。 
由 图 2-18 可 以 看 出 ， 数 据 已 经 按照 地 区 进行 了 划分 ， 我 们 可 以 很 方便 地 了 解 各 个 地 区 的 
销售 情况 并 进行 业绩 评价 。 
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Cr = 
HE WME EO ED) RD 


息 并 5 六 伯 


图 校 分 由 人生 开行 文 件 排 奈 (S) 
国文 件 已 指 斥 全 


当前 状态 ;“ 控 组 分 析 " 美 闭 > 


Le (DD) BR] | 
图 2-17 “ 拆 分 文件 ”对 话 框 图 2-18 分 解 后 的 数据 文件 
2. 数据 文件 的 合并 


数据 文件 的 合并 分 为 横向 合并 和 纵向 合并 。 横 向 合并 是 指 从 外 部 数据 文件 中 增加 变量 到 当 
前 数据 文件 ， 纵 向 合并 是 指 从 外 部 数据 文件 中 增加 观测 量 到 当前 的 数据 文件 中 。 


(1 ) 数据 文件 的 横向 合并 

数据 文件 的 横向 合并 也 分 为 两 种 情况 :一 种 情况 是 将 外 部 数据 文件 的 变量 追加 到 当前 数据 
文件 中 ; 另 一 种 是 按 共同 的 关键 变量 合并 。 本 节 以 学 生成 绩 添加 为 例 讲 解数 据 文件 的 横向 合并 。 
本 例 中 , 我 们 希望 将 学 生 的 数学 成 绩 添加 到 物理 成 绩 之 后 形成 学 生 的 总 成 绩 表 。 横 向 合并 前 的 
物理 成 绩 与 数学 成 绩 的 数据 文件 分 别 如 图 2-19 和 图 2-20 所 示 。 


i 机 0 S055 Static mm - 6 x [TY - oO x 
[RD WME E60 NRO) WMD SW WD NG) XNAFD {RD OW MW 


风 : 22 直 训 里 | 22 二 
SR onal na | re | nn | ng | ne [| an | SR TAU 和 ae | nan | re | nm | ne | ne [ 
1 


epeeydrdsgnen 


[ _ [LE ECE TEL .7 
图 2-19 学 生 的 物理 成 绩 图 2-20 学 生 的 数学 成 绩 
数据 文件 的 横向 合并 的 具体 方法 如 下 : 


1) 在 菜单 栏 中 选择 “数据 ”|“ 合 并 文件 ”|“ 添 加 变量 ”命令 ,打开 如 图 2-21 所 示 的 “ 变 
量 添 加 至 ”对 话 框 。 
用 户 可 以 选择 已 经 打开 的 数据 文件 , 或 者 从 外 部 选择 一 个 已 经 保存 的 SPSS 数据 文件 作为 
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与 当前 文件 合并 的 文件 ， 选 择 完毕 后 单 击 “ 继 续 ” 按 钮 。 本 例 选中 “外 部 SPSS Statistics 数据 
文件 ” 单 选 按 钮 ， 然 后 选择 “数学 成 绩 ” 文 件 ， 打 开 如 图 2-22 所 示 的 “变量 添加 自 ” 对 话 框 。 


新 的 活动 元 据 集 (N): 


内 支 旺 寺 加 至 物理 成 绩 .sav[ 数 据 集 1] x 
从 打开 上) 数据 集 加 | 表 中 或 者 从 文件 中 选择 雪 据 集 ， 以 便 特 其 与 竺 动 未 据 集合 并 


数学 成 绩 .sav 堵 据 集 引 


口外 部 SPSS Statistics 数据 文件 


Ei 
非 SPSS Statistics 数据 文件 必须 先 在 SP3S Statistics 中 打开 ， 然 后 才能 用 于 合并 。 


[jam Cw) 


图 2-21 “变量 添加 至 ”对 话 框 图 2-22 “变量 添加 自 ” 对 话 框 


2) 选择 合并 后 数据 文件 中 的 变量 

“排除 的 变量 "列表 框 用 于 显示 不 出 现在 新 合并 的 数据 文件 中 的 变量 以 及 当前 数据 文件 和 
外 部 数据 文件 中 的 重 名 变量 。 

“新 的 活动 数据 集 ”列表 框 用 于 显示 合并 后 的 数据 集中 包含 的 变量 。 变 量 名 称 后 面 带 有 
“+” 的 表示 来 自 外 部 数据 文件 的 变量 ， 变 量 名 称 后 面 带 有 “* ”的 表示 当前 数据 文件 中 的 变 
量 。 如 果 用 户 希望 将 重 名 变量 也 加 入 合并 后 的 文件 ,可 以 在 “排除 的 变量 ” 列表 杠 中 选择 该 变 
量 并 单 击 “ 重 命名 ”按钮 对 其 重新 命名 ， 再 单 击 国 按钮 将 该 变量 选 入 “新 的 活动 数据 集 ” 列 
表 框 中 ， 本 例 无 须 对 此 进行 操作 。 

3) 设置 关键 变量 

如 果 两 个 数据 文件 具有 相同 的 个 案 数 上 排列 顺序 相同 ,用 户 无 须 指定 关键 变量 。 否 则 ， 需 
要 选择 关键 变量 并 以 关键 变量 的 升序 对 两 个 数据 集 进 行 排序 .只 有 当前 数据 文件 和 外 部 数据 六 
件 中 的 重 名 变量 才 可 以 作为 关键 变量 , 选中 “两 个 数据 集中 的 个 案 都 按键 变量 的 顺序 进行 排序 ” 
复 选 框 并 选择 该 变量 ， 单 击 国 按钮 将 该 其 选 入 “ 键 变量 ”列表 框 中 ， 本 例 由 于 学 生 的 成 绩 均 
按照 学 号 进行 排序 ， 故 不 必 指定 键 变量 。 

选中 “两 个 数据 集中 的 个 案 都 按键 变量 的 顺序 进行 排序 ” 复 选 框 将 激活 下 面 的 3 个 单 选 按 钥 。 

。 非 活动 数据 集 是 键 控 表 : 表示 将 非 活动 数据 文件 作为 关键 表 ， 即 只 将 外 部 数据 文件 中 与 活 

动 数据 集中 对 应 变量 值 相同 的 观测 量 并 入 新 的 数据 文件 。 
。 活动 数据 集 是 键 控 表 : 表示 将 非 活动 数据 文件 作为 关键 表 。 
。 两 个 文件 都 提供 个 案 : 表示 将 两 个 数据 文件 的 所 有 观测 量 合并 。 


4) 单 击 “确定 ”按钮 ， 即 可 完成 文件 横向 合并 操作 
由 图 2-23 可 以 看 出 数学 成 绩 已 经 作为 一 个 新 的 变量 被 添加 到 了 学 生成 绩 表 中 ， 我 们 得 到 
了 一 个 包含 数学 和 物理 成 绩 的 成 绩 总 表 。 


第 2 章 SPSS 24.0 数据 管理 


前 :物理 或 靶 sav [小 所 条 1] - 四 M spss Statistics 妆 尖 仿生 天 oO x 
EE EE 


SHSsRdnsdssadenRy 


[ BM SPSS Slatstcs 处 理 得 友 下 请 | | [unicodeON| | 


2-23 ”横向 合并 后 的 数据 文件 


(2 ) 数据 文件 的 纵向 合并 

数据 文件 的 纵向 合并 只 能 合并 两 个 数据 文件 中 相同 的 变量 。 本 节 同 样 以 学 生成 绩 添加 为 例 
讲解 数据 文件 的 纵向 合并 。 与 上 一 个 例子 不 同 , 本 例 中 我 们 希望 将 二 考场 学 生 的 数学 成 绩 添加 
到 一 考场 学 生 的 成 绩 之 后 形成 学 生 的 总 数学 成 绩 表 ， 其 中 一 考场 为 学 号 1~50 号 的 学 生 ， 二 考 
场 为 学 号 51~80 号 的 学 生 。 纵 向 合并 前 的 两 个 考场 学 生 的 数学 成 绩 数据 分 别 如 图 2-24 和 图 2-25 
所 示 。 

st sv | 耻 央 条 1 - 旧 M 5P55 Statistics 直 生 同名 加 D 站 NM 5P55 Statntics BR 
COR I 


J ss suoncs NR | Juneooe oN] | 


图 2-24 一 考场 学 生 的 数学 成 绩 图 2-25 二 考场 学 生 的 数学 成 绩 
数据 文件 纵向 合并 的 具体 方法 如 下 : 
1) 在 菜单 栏 中 选择 “数据 ”|“ 合 并 文件 ”|“ 添 加 个 案 ” 命 令 , 打开 如 图 2-26 所 示 的 “将 
个 案 添 加 至 ”对 话 框 。 


本 例 在 “外 部 SPSS Statistics 数据 文件 ”下 选择 “二 考场 数学 成 绩 ” 文 件 ， 然 后 打开 如 图 
2-27 所 示 的 “添加 个 案 自 数据 集 2” 对 话 框 。 
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息 语 i0 个 款 至 一 考场 数学 成 绩 .sav[ 改 据 集 1] x 


从 打开 的 数据 集 的 列表 中 或 者 从 文件 中 迁 择 数 握 集 ， 以 便 构 其 与 舌 动 堵 据 集合 并 
#8 集 (0) 
= 考场 开学 也 线 sav 提 集 2] 


口外 部 SPSS Statstics 数据 文件 


非 SPSS Statistics 教 据 文 件 必 须 先 在 SPSS Statistics 中 打开 ， 然后 才能 用 于 合并 。 


Em Ee) 


图 2-26 “添加 个 案 至 ”对 话 框 图 2-27 “添加 个 案 自 数据 集 2” 对 话 框 
2) 进行 相应 的 设置 。 
“ 非 成 对 变量 ”列表 框 中 显示 的 是 未 能 匹配 的 变量 , “新 的 活动 数据 集中 的 变量 ”列表 框 
中 显示 的 是 两 个 数据 文件 中 文件 名 和 数据 类 型 都 相同 的 变量 .对 于 数据 类 型 相同 而 名 称 不 同 的 
变量 ， 用 户 可 以 通过 选择 这 些 变量 后 单 击 “配对 ”按钮 来 匹配 两 个 变量 。 
3) 单 击 “确定 ”按钮 ， 即 可 完成 文件 纵向 合并 操作 。 合 并 后 的 部 分 数据 文件 如 图 2-28 所 示 。 


Fm 1] OM PS Sthics ORR 3 


TT 允 T 台 贡生 难 


图 2-28 纵向 合并 后 的 数据 文件 


由 图 2-28 可 以 看 出 , 一 考场 的 数学 成 绩 和 二 考场 的 数学 成 绩 已 经 被 合并 了 , 学 号 为 51~80 
号 学 生 的 数学 成 绩 已 经 被 合并 到 了 一 考场 学 生 数 学 成 绩 的 后 面 ， 形 成 了 总 数学 成 绩 单 。 


2.5.4 ”数据 文件 的 变换 


不 同 的 分 析 方 法 需要 不 同 的 数据 文件 结构 , 当 现 有 的 观测 量 和 变量 的 分 布 与 分 析 的 要 求 不 
一 致 时 ,我 们 就 要 对 数据 文件 进行 变换 。 数 据 文件 的 变换 是 指 将 数据 文件 的 观测 量 与 变量 互 换 。 


36 


第 2 章 SPSS 24.0 数据 管理 


本 节 即 讲解 数据 文件 的 变换 操作 ， 为 简便 起 见 ， 我 们 选取 20 名 学 生 的 数学 成 绩 作为 其 产品 调 
查 中 被 调查 者 对 该 产品 的 评分 , 我 们 希望 以 学 号 作为 变量 , 得 分 作为 观测 量 ， 从 而 得 到 一 个 调 
查 表 。 变 换 前 的 数据 文件 如 图 2-29 所 示 。 


起 次 呈 洁 二 sav 茹 据 生 1] -IBM SPSS Statistics 数 窜 全 拒 对 一 口 x 


BM SPSS Stalistics 外 更生 序 叉 绩 | |Unicode ON 
图 2-29 变换 前 的 数据 文件 

数据 文件 的 变换 操作 具体 如 下 所 示 : 

1) 在 菜单 栏 中 选择 “数据 ”|“ 转 置 ”命令 ,打开 如 图 2-30 所 示 的 “ 转 置 ”对 话 框 。 

2) 选择 要 变换 的 变量 ， 单 击 国 按 钮 将 其 先入 “变量 ”列表 框 中 。 如 果 一 个 变量 的 所 有 观 
测量 的 取 值 各 不 相同 ， 则 可 以 将 其 作为 名 称 变量 ， 单 击 国 | 按 钮 将 其 先入“ 名称 变量 ”列表 框 ， 
如 图 2-31 所 示 。 如 果 用 户 不 指定 名 称 变量 ， 系 统 将 默认 以 “VAR0000X” 命 名 变量 。 本 例 将 
“数学 ”变量 选 入 “变量 ”列表 框 中 ， 将 “学 号 ” 选 入 “名 称 变量 ”列表 框 中 。 


图 2-30 “ 转 置 ”对 话 框 图 2-31 选择 变量 


3) 单 击 “确定 ”按钮 ， 即 可 完成 文件 变换 操作 。 转 置 后 的 数据 文件 如 图 2-32 所 示 。 
从 图 2-32 中 可 以 看 出 ，k 加 上 学 生 的 学 号 成 为 变量 ， 每 一 个 相应 的 学 号 都 对 应 着 这 个 学 
生 的 数学 成 绩 。 
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CE 


1M SPSS Statstics 外 潭 程 序 统 坑 | | [UnicodeON| | 


2-32 ” 转 置 后 的 数据 文件 


2.5.5 ”观测 量 的 加 权 


对 数据 进行 加 权 处 理 是 我 们 使 用 SPSS 提供 某 些 分 析 方 法 的 重要 前 提 。 数 据 在 进行 加 权 后 ， 
当前 的 权重 将 被 保存 在 数据 中 。 当 进行 相应 的 分 析 时 ,用 户 无 须 再 次 进行 加 权 操作 。 本 节 以 对 
广告 的 效果 观测 为 例 , 讲解 数据 的 加 权 操作 。 本 例 给 出 了 消费 者 购买 行为 与 是 否 看 过 广告 之 间 
的 联系 ， 按 “是 否 看 过 广告 ”和 “是 否 购买 商品 ”两 个 标准 ， 消 费 者 被 分 为 4 类， 研究 者 对 这 
4 类 消费 者 分 别 进行 了 调查 。 由 于 各 种 情况 下 调查 的 人 数 不 同 , 如 果 将 4 种 情况 等 同 进行 分 析 ， 
势必 由 于 各 种 情况 的 观测 数目 不 同 导致 分 析 的 偏 误 , 因此 我 们 需要 对 观测 量 进行 加 权 。 加权 前 
的 数据 文件 如 图 2-33 所 示 。 


国生 Rin 公 提 fF sav 肝 操 委 1] IBM spss Statistics 贱 所 过 人 呈 


TBW SPSS Statistics 处 至 程 记 纺 络 ”|Unicode-ON | | 权重 开启 


图 2-33 ”加 权 前 的 数据 文件 
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加 权 操作 的 具体 步骤 如 下 所 示 。 
ETI01 在 菜单 栏 中 选择 “数据 |“ 个案 加 权 ” 命 令 ， 打 开 如 图 2-34 所 示 的 “个 案 加 权 ” 对 
话 框 。 
。 不 对 个 案 加 权 : 表示 对 当前 数据 集 不 进行 加 权 ， 该 项 一 般 用 于 对 已 经 加 权 的 数 
据 集 取消 加 权 。 
。 个 案 加 权 系数 : 表示 对 当前 数据 集 进行 加 权 ， 同 时 激活 “频率 变量 ”列表 框 。 
人 2 选择 加 权 变量 。 加 权 变 量 用 于 定制 权重 ,从 变量 列表 框 中 选择 作为 加 权 变 量 的 变量 ， 
单 击 国 按钮 将 其 选 入 “频率 变量 ”列表 框 ， 如 图 2-35 所 示 ， 本 例 选 择 “ 人 数 ”变量 
作为 加 权 频 率 变 量 . 


当前 近 态 : 沾 赛 加 权 季 瑙 ; 人 救 


Lu J we) 本 | a Hm 
图 2-34 “个 案 加 权 ” 对 话 框 2-35 ”加权 变量 的 选择 


ZI03 单 击 “ 确 定 ” 按 钮 ， 即 可 进行 加 权 操作 。 加 权 后 状态 栏 右 侧 会 显示 权重 开启 信息 ， 
表示 数据 已 经 加 权 ， 如 图 2-36 所 示 。 


| mf ov 本 本 EM sp55 stdicy 下 本 - 6 x 


[LEE 


2-36 加 权 后 的 数据 文件 


2.6 变量 的 转换 与 运算 


变量 是 SPSS 数据 结构 中 重要 的 组 成 部 分 ， 是 统计 分 析 的 主要 对 象 。 本 节 对 SPSS 24.0 中 
有 关 变 量 的 操作 进行 介绍 。 
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2.6.1 插入 与 删除 变量 


有 时 我 们 需要 增加 新 的 信息 ， 如 由 于 对 外 开放 ， 在 工资 统计 中 需要 加 入 外 资 企 业 的 信息 ， 
此 时 会 用 到 插入 新 的 变量 操作 ， 有 时 候 也 需要 删除 无 用 的 变量 。 

与 观测 量 的 插入 和 删除 一 样 , 用 户 可 以 通过 菜单 命令 插入 变量 , 也 可 以 通过 工具 栏 和 鼠标 
右键 快捷 菜单 插入 变量 ， 系 统 默 认 插 入 的 新 变量 为 标准 数值 型 变量 ， 变 量 名 为 VAR0000X。 
具体 操作 方法 可 参照 2.4.1 小 节 。 

在 SPSS 数据 编辑 器 的 变量 视图 下 ， 同 样 可 以 完成 变量 的 插入 和 删除 操作 ， 方 法 与 在 数据 
视图 下 基本 一 致 ， 只 是 操作 对 象 变 成 了 行 。 


2.6.2 ”根据 已 存在 的 变量 建立 新 变量 


在 实际 的 数据 分 析 过 程 中 经 常会 利用 多 个 变量 之 间 的 关系 来 生成 新 的 变量 。SPSS 的 变量 
生成 过 程 可 以 方便 实现 这 项 功能 。 本 节 将 以 平均 成 绩 的 计算 为 例 来 讲解 根据 已 存在 的 变量 建立 
新 变量 的 过 程 ， 按 照 “平均 成 绩 = (数学 成 绩 + 物 理 成 绩 ) /2” 的 公式 计算 学 生 的 平均 成 绩 。 原 
始 数 据 文件 如 图 2-37 所 示 。 


网 * 计 算 生成 新 的 训 量 sav [ 歼 氛 入 1] - IBM SPSS Statistics 数据 光亮 器 一 口 x 


I IBM SPSS Statistics 处 理 程序 溉 绪 | | Unicode-ON 


图 2-37 未 产生 新 变量 的 数据 文件 
1) 在 菜单 栏 中 选择 “转换 ”|“ 计 算 变 量 ” 命 令 ， 打 开 如 图 2-38 所 示 的 “计算 变量 ”对 
话 框 。 
2) 定制 目标 变量 。 
在 “目标 变量 ”文本 框 中 输入 目标 变量 的 名 称 ， 单 击 “ 类 型 和 标签 ”按钮 ， 在 弹出 的 “ 计 
算 变 量 ;: 类 型 和 标签 ”对 话 框 中 设置 新 生成 变量 的 类 型 与 标签 。 本 例 选 中 “标签 ” 单 选 按 钮 ， 
并 在 其 后 的 文本 框 中 输入 变量 标签 “平均 成 绩 ”， 如 图 2-39 所 示 。 
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EOE NEY 
“计算 变量 :类 型 和 标签 ”对 话 框 


图 2-38 “计算 变量 ”对 话 框 图 2-39 

3) 设置 新 变量 的 生成 表达 式 。 

从 源 变量 列表 框 中 选择 生成 新 变量 所 依据 的 变量 ， 单 击 国 按 钮 将 选中 的 变量 先入 “数字 
表达 式 ” 列 表 框 中 参与 模型 表达 式 的 构建 ， 然 后 从 “函数 组 ”列表 框 中 选择 相应 的 函数 类 型 ， 
“函数 和 特殊 变量 ”列表 框 中 会 显示 出 具体 的 函数 类 型 与 特殊 变量 , 用 户 可 以 选择 相应 的 函数 
并 单 击 国 | 按钮 将 其 选 入 “数字 表达 式 ” 列 表 框 中 参与 表达 式 的 构建 。 可 以 利用 “数字 表达 式 ” 
下 方 的 键盘 进行 数字 与 符号 的 输入 ， 如 图 2-40 所 示 。 

4) 设置 个 案 选 择 条 件 。 

单 击 “ 如 果 ” 按 钮 ， 打 开 如 图 2-41 所 示 的 “计算 变量 : 焉 个案” 对话 框 。 


EE 


Se 
pA ES 


rex 

目标 权重 或 

分 = ju 
人 F 全 

Pa rasal 

Fuad 


[EE 
Lee me ea mm | 


图 2-40 设置 新 变量 的 生成 表达 式 


CoE -En 
图 2-41 个 案 选 择 条 件 

如 选中 “包括 所 有 个 案 ” 单 选 按 钮 ， 则 表示 变量 中 的 全 部 个 案 均 参与 计算 ; 选中 “在 个 案 
满足 条 件 时 包括 ” 单 选 按钮 ， 则 激活 个 案 选 择 条 件 设置 部 分 ,该 部 分 与 新 变量 的 生成 表达 式 的 
设置 方法 基本 相同 ， 在 此 不 再 袭 述 。 本 例 选中 “包括 所 有 个 案 ” 单 选 按钮 。 

5) 单 击 “ 确 定 ” 按 钮 ， 就 可 以 计算 新 变量 了 。 新 变量 的 生成 结果 如 图 2-42 所 示 。 
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图 2-42 产生 新 变量 的 输出 结果 
从 图 2-42 中 可 以 看 出 ， 数 学 和 物理 的 平均 成 绩 被 计算 出 来 并 作为 一 个 新 变量 被 保存 。 


2.6.3 ”产生 计数 变量 
有 时 我 们 需要 统计 满足 某 一 个 条 件 观测 的 个 数 , 如 对 学 生 党 员 人 数 进行 统计 。 计数 变量 的 
功能 就 是 对 变量 中 满足 一 定 条 件 的 个 案 数 进行 统计 , 并 保存 计数 结果 , 本 节 以 优秀 人 次 的 计算 
为 例 讲解 产生 计数 变量 的 过 程 , 本 例 要 求 计 算 考 生 的 数学 和 物理 成 绩优 秀 人 次 ,判定 成 绩 为 优 
秀 的 标准 为 成 绩 大 于 等 于 80 分 。 未 产生 计数 变量 的 原始 数据 文件 如 图 2-43 所 示 。 


ti sy MR] BM SP55 Sutistics SRG 
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图 2-43 未 产生 计数 变量 的 原始 数据 文件 
产生 计数 变量 的 过 程 如 下 所 示 : 
(1) 在 菜单 栏 中 选择 “转换 ”|“ 对 个 案 中 的 值 进行 计数 ”命令 ， 打 开 如 图 2-44 所 示 的 
“计算 个 案 中 值 的 出 现 次 数 ” 对 话 框 。 
(2) 选择 要 进行 计数 的 变量 并 设置 计数 变量 。 
在 源 变 量 列表 框 中 选择 要 进行 计数 的 变量 ， 单 击 国 按 钮 将 其 选 入 “变量 ”列表 框 中 ， 本 
例 将 “数学 ”变量 和 “物理 ”变量 选 入 列表 框 ， 如 图 2-45 所 示 。 
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图 2-44 “计算 个 案 中 值 的 出 现 次 数 ” 对 话 框 2-45 ”计数 变量 的 选择 


。 “目标 变量 ”文本 框 用 于 输入 产生 的 计数 变量 的 名 称 。 
。 “目标 标签 ”文本 框 用 于 输入 产生 的 计数 变量 的 变量 标签 。 本 例 在 “目标 变量 ”文本 框 中 


输入 “优秀 人 次 ” 起 对 个 委 中 的 全 进行 计数 ;要 计数 的 硬 x 
3) 定义 计数 对 象 。 EF : — 要 计划 的 从 (0): 
单 击 “ 定 义 值 ” 按 钮 ， 弹 出 如 图 2-46 所 示 的 。 二 
“对 个 案 中 的 值 进行 计数 ， 要 计数 的 值 ”对 话 框 。 Omasisanasau 
用 户 可 以 在 “ 值 ”选项 组 中 选择 计数 对 象 , 单 | 
击 “添加 ”按钮 将 其 选 入 右边 的 “要 计数 的 值 ” 列 Ey 
表 框 中 。 | 
。 值 : 系统 将 以 用 户 在 下 面 文本 框 中 输入 的 值 | ov, AR 
作为 计数 对 象 。 一 
。 系统 缺失 值 :将 把 系统 指定 缺失 值 作为 计数 (ets) Cnn Cam) 
对 象 Ee es 
。 系统 钠 失 值 或 用 户 纳什， 将 把 系统 指定 针 。 
失 值 或 用 户 指定 缺失 值 作为 计数 对 象 。 


。 范围 : 系统 将 把 用 户 在 下 面 文本 框 中 输入 的 数值 范围 内 的 观测 量 数 作为 计数 对 象 。 

。 范围 ， 从 最 低 到 值 : 系统 将 把 负 无 穷 到 用 户 在 下 面 文本 框 中 输入 的 数值 范围 内 的 观测 量 数 
作为 计数 对 象 。 

。 范围 ， 从 值 到 最 高 : 将 把 用 户 在 下 面 文本 框 中 输入 的 数值 到 正 无 穷 范围 内 的 观测 量 数 作为 
计数 对 象 。 

本 例 选 中 “范围 ， 从 值 到 最 高 ” 单 选 按钮 ， 并 在 其 后 的 文本 框 中 输入 80。 


4) 然后 单 击 “ 添 加 ”按钮 ， 再 单 击 “ 继 续 ” 按 钮 ， 最 后 在 “计算 个 案 中 值 的 出 现 次 数 ” 
对 话 框 中 单 击 “ 确 定 ”按钮 ， 就 可 以 生成 计数 变量 。 生 成 计数 变量 后 的 数据 文件 如 图 2-47 
所 示 。 


由 图 2-47 可 以 看 出 ，SPSS 生成 了 名 为 “优秀 人 次 ”的 计数 变量 ， 该 变量 统计 了 每 个 观测 
中 符合 条 件 的 值 的 个 数 ， 通 过 生成 计数 变量 我 们 可 以 了 解 各 个 学 生 的 成 绩 情 况 。 
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2-47 计数 变量 的 生成 


变量 的 重新 赋值 


对 于 数值 型 变量 ,用 户 在 数据 编辑 和 整理 过 程 中 可 以 对 某 些 变量 一 定 取 值 范围 内 的 观测 量 
进行 重新 赋值 。 例 如 ， 在 学 生成 绩 中 ， 由 于 统计 的 失误 ， 导 致 一 部 分 学 生 的 成 绩 需 要 更 正 ， 此 
时 我 们 将 用 到 变量 的 赋值 操作 。 变 量 的 重新 赋值 有 两 种 方式 : 一 种 是 对 变量 自身 重新 赋值 ， 另 


一 种 是 赋值 4 


成 新 的 变量 ， 这 两 种 方法 的 具体 实现 过 程 下 面 都 将 介绍 。 


本 节 以 对 学 生 的 成 绩 评分 为 例 讲解 对 变量 重新 赋值 的 过 程 , 该 例 要 求 将 百分制 成 绩 换 算 为 
优良 、 及 格 与 不 及 格 3 类 ， 分 别 用 数字 1、2、3 代替 。 优 秀 标准 为 成 绩 大 于 等 于 80 分 、 及 格 
标准 为 成 绩 大 于 等 于 60 分 。 原 始 数据 文件 如 图 2-42 所 示 。 


1. 对 变 


量 自身 重新 赋值 


对 变量 自身 的 重新 赋值 不 产生 新 变量 ， 变 量 的 新 值 直接 在 原来 位 置 蔡 代 变量 的 原 值 。 


GI01 在 菜单 栏 中 选择 “转换 ”|* 重 新 编码 为 相同 的 变量 ”命令 , 打开 如 图 2-48 所 示 的 “ 重 
新 编码 为 相同 的 变量 ”对 话 框 。 
(DT02 选择 要 重新 赋值 的 变量 。 选 择 要 重新 赋值 的 变量 ， 单 击 较 按钮 将 其 选 入 右 侧 的 “ 数 
字 变 量 ”列表 框 中 ， 本 例 将 “数学 ”变量 和 “物理 ”变量 选 入 数字 变量 列表 框 ， 如 
图 2-49 所 示 。 
起 重新 岳 码 为 介 司 的 变量 受 往生 #5 为 得 同 8S 交 县 x 
PETTE 古国 
2 起 | 
迪 
EL 
ETETREES 和 [| 
LE ] 7 Ea (ea) (xm) EE 
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3) 定义 旧 值 与 新 值 。 
单 击 “ 旧 值 和 新 值 ”按钮 ， 弹 出 如 图 2-50 所 示 的 “重新 编码 为 相同 变量 : 旧 值 和 新 值 ” 


瞧 重新 蜗 三 为 自 同 变 旺 ; | 日 信和 新 下 这 
ss 新 入 
人 | em: 
[Loki 
日 系 吉庆 失 值 (3) 
上 口 条 各 失 介 或 用 户 负 失 信 LU) LE 
OY): 
[ Ei 
[El 
,从 县 从 (GQ): ls 
口 末 国 ， 从 信 到 遇 高 (E): 
口 所 有 其他 从 (Q) 


2-50 “重新 编码 为 相同 变量 : 旧 值 和 新 值 ”对 话 框 


。 “ 旧 值 ”选项 组 : 该 选项 组 用 于 设置 要 改变 的 值 的 范围 ,其 中 选项 及 其 含义 与 图 2-46 中 的 
“ 值 ” 大 致 相同 ， 只 多 出 一 个 “所 有 其 他 值 ”选项 。 

。 “新 值 ”选项 组 : 该 选项 组 用 于 设置 变量 的 新 赋值 。 如 选中 “ 值 ” 单 选 按钮 ， 表 示 由 
用 户 指定 该 值 , 用 户 可 以 在 其 后 的 文本 框 中 输入 变量 的 新 赋值 ; 如 选中 “系统 缺失 值 ” 
单 选 按钮 ， 表 示 将 把 系统 指定 缺失 值 作为 新 赋值 。 


用 户 设置 完 旧 值 和 新 值 的 赋值 配对 后 ， 可 以 单 击 “ 添 加 ”按钮 将 其 选 入 右边 的 “ 旧 --> 新 ” 
列表 框 中 。 对 于 该 列表 框 中 的 对 象 ， 用 户 可 以 单 击 “ 更 改 ” 按 钮 进行 修改 ， 或 者 单 击 “ 删 除 ” 
按钮 予以 删除 。 

本 例 将 成 绩 大 于 等 于 80 分 (优秀 ) 、 小 于 80 分 大 于 等 于 60 分 (及格) 和 小 于 60 分 的 变 
量 分 别 用 数字 1、2、3 代替 。 

4) 设置 个 案 选择 条 件 

个 案 选择 条 件 的 设置 方法 在 前 面 章节 已 有 介绍 ， 在 此 不 再 更 述 。 

5) 单 击 “ 确 定 ”按钮 ， 就 可 以 对 变量 重新 赋值 。 

重新 赋值 后 的 变量 如 图 2-51 所 示 。 

由 图 2-51 可 以 看 出 ， 原 始 分 数 均 被 表示 级 别 的 数字 1、2 和 3 代替 ， 变 量 的 新 值 直接 在 原 
来 位 置 蔡 代 了 变量 的 原 值 。 


2. 赋值 生成 新 的 变量 


与 变量 自身 重新 赋值 不 同 ,赋值 生成 新 的 变量 操作 会 将 变量 的 新 值 作 为 一 个 新 的 变量 进行 
保存 。 


1) 在 菜单 栏 中 选择 “转换 ”|“ 重 新 编码 为 不 同 变量 ”命令 ， 打 开 如 图 2-52 所 示 的 “ 重 
新 编码 为 不 同 变量 ”对 话 框 。 
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外 本 司 二 1] [eM spss statistics 次 二 疙 二 尖 - oO x 
文件 中。 编 委 全 ) 重 看 WV) 甘 据 虽 ) ”转换 (分析 内) 直 消 W) 本 HG) 实用 程序 WW) 扩展 0 证 DQ 帮助) 


上 星 名 国 ] 3 了 Sa 辐 


— EE 


图 2-51 变量 自身 重新 赋值 后 的 数据 文件 


图 2-52 “重新 编码 为 不 同 变量 ”对 话 框 


2) 选择 要 重新 赋值 的 变量 。 

选择 要 重新 赋值 的 变量 ， 单 击 国 | 按 钮 将 其 选 入 “数字 变量 -> 输出 变量 ”列表 框 中 ， 并 在 
“输出 变量 ”选项 组 中 输入 输出 变量 的 信息 ， 单 击 “ 变 化 量 ” 按 钮 。 本 例 建 立 “ 物 理 一 物理 等 
级 ”和 “数学 一 数学 等 级 ”两 个 变量 转换 ， 如 图 2-53 所 示 。 


生生 入 由 为 下 司 码 号 x 
过失 二 [多 时 
CEI 数字 教学 守 了 ps 
HA 
ED): 
册 区 三思 
ET 
a 
| 


图 2-53 ”选择 重新 赋值 的 变量 
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3) 定义 旧 值 与 新 值 。 
单 击 “ 旧 值 和 新 值 ”按钮 ， 弹 出 如 图 2-54 所 示 的 “重新 编码 为 不 同 变量 : 旧 值 和 新 值 ” 
对 话 框 。 


全 二 i 为 不 同 交 旺 : 旧 全 和 新 下 并 
lB 值 条 全 
值 W: | 园 什 CU: 
日 系统 如 失 值 中 
曲 肌 和 黄 失 什 SG) © udm) 
曲 各 失信 或 用 户 潜 失 值 () 
OY): 有 旧 一 新 D): 


图 2-54 “重新 编码 为 不 同 变量 ， 旧 值 和 新 值 ”对 话 框 


。 “新 值 ”选项 组 : “新 值 ”选项 组 中 较 图 2-50 中 多 出 一 个 “复制 旧 值 ” 单 选 按钮 ， 若 
选中 该 单 选 按钮 ， 系 统 将 不 改变 旧 值 。 
。 “输出 变量 是 字符 串 ” 复 选 框 : 如 选中 该 复 选 框 ， 系 统 将 把 新 赋值 生成 的 变量 定制 为 字符 
串 变 量 。 
4) 单 击 “ 确 定 ”按钮 ， 就 可 以 对 变量 重新 赋值 。 赋 值 产生 新 变量 的 结果 如 图 2-55 所 示 。 
sn mae se nn WD oe 本 ngpu ya spe wht 


EERSFHHNVBIRBR 
BsndBdsaleny 


JBM SPSS Statstcs 处 理 程 序 壤 络 |[Unicode:ON I 


图 2-55 ”赋值 后 产生 的 新 变量 


由 图 2-55 可 以 看 出 ， 原 始 分 数 后 面 跟随 的 是 科目 成 绩 的 等 级 ， 变 量 重新 赋值 后 产生 了 新 
变量 “数学 等 级 ”和 “物理 等 级 ”。 
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2.6.5 ”变量 取 值 的 求 等 级 


有 时 我 们 想 知道 某 一 个 观测 在 已 知 条 件 下 观测 中 的 位 置 ， 而 又 不 希望 打破 数据 现 有 的 排 
序 , 此 时 将 用 到 变量 取 值 求 等 级 的 功能 。 所 谓 变量 取 值 的 等 级 就 是 变量 在 某 指定 条 件 下 的 排列 
中 所 处 的 位 置 , 等 级 反映 了 变量 在 有 序 序列 里 的 位 置信 息 , 本 节 以 学 生 排 名 为 例 介 绍 变量 取 值 
求 等 级 的 操作 方法 , 本 例 中 要 求 按照 学 生 的 成 绩 得 到 学 生 的 排名 信息 , 如 果 成 绩 相 同 则 并 列 名 
次 。 未 进行 求 等 级 的 原始 数据 文件 如 图 2-56 所 示 。 


起 ,二 了 你 匠 sav 浇 有 条 1] - IM Spss Statistics 关机 要 四 本 
文件 编 弹 三 ) ”查看 WM) 教 据 [D) 转 搞 个。 分析 办。 直 硝 是。 本 fi(G) 实用 程序 (WU 扩展 00 窗口) 帮助 (td) 


加 局 Du 玉芝 二 = 必 沾 “2 本 


[ wa | gm | wa 


PSs Sansbcs 允 赤 和 Unicooe ON 
图 2-56 未 进行 求 等 级 的 原始 数据 文件 
变量 取 值 求 等 级 的 具体 方法 如 下 : 


1) 在 菜单 栏 中 选择 “转换 ”|“ 个 案 排 秩 ” 命 令 ， 打 开 如 图 2-57 所 示 的 “个 案 排 秩 ” 对 
话 框 。 

2) 选择 要 重新 赋值 的 变量 。 

选择 要 进行 等 级 排序 的 变量 ， 单 击 国 按 钮 将 其 先入 “变量 ”列表 框 中 。 如 果 需 要 进行 分 组 ， 
则 选择 分 组 变量 并 单 击 姑 按钮 将 其 先入 “依据 ”列表 框 中 ， 本 例 将 “成 绩 ” 变 量 先入“ 变量” 
列表 框 ， 如 图 2-58 所 示 。 指 定 了 分 组 标准 后 ， 系 统 会 对 各 个 组 分 别 计算 和 输出 变量 的 等 级 。 

3) 进行 相应 的 设置 。 

(“类 型 排 秩 ”设置 。 单 击 “ 类 型 排 秩 ”按钮 ， 弹 出 如 图 2-59 所 示 的 “个 案 排 秩 : 类 型 ” 

该 对 话 框 用 于 设置 等 级 排序 的 相关 方法 和 参数 ， 共 有 8 个 复 选 框 。 


。 秩 : 表示 使 用 简单 等 级 。 

。 萨 维 奇 得 分 : 表示 使 用 基于 指数 分 布 的 Savage 得 分 作为 等 级 排序 的 依据 。 

。 分 数 排序 : 表示 使 用 每 个 等 级 除 以 带 有 有 效 值 的 个 案 数 ， 再 乘 以 100 的 结果 作为 等 级 排序 
的 依据 。 
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x | | 外 人 HI 区 x 
EEC Ei | | 7 下 于 Er 
成 绩 一 
= -一 国 
依据 (B): 侠 据 人): 

邮 
将 秩 1 戌 予 局 显示 摘要 表 (D) 将 秩 1 显 予 区 豆 示 摘要 来 (D) 
回 最 小 值 S) 回 最 小 值 (S) 
日 最 大 值 L) 日 最 大 值 (L) 

wo Eg EaigEaa [me J #8®) (BE®) a ji | 


图 2-57 “个 案 排 秩 ” 对 话 框 图 2-58 “个 案 排 秩 ” 对 话 框 的 变量 选择 
。 百分比 分 数 秩 : 表示 使 用 等 级 除 以 非 缺 失 观 测量 的 权重 和 作为 等 级 排序 的 依据 。 
。 个 案 权重 总 和 : 表示 使 用 各 观测 量 权重 之 和 作为 等 级 排序 的 依据 。 
。 Ntiles: 表示 使 用 百 分 位 数 作为 等 级 排序 的 依据 ， 选 择 该 项 后 用 户 可 以 在 其 后 的 文本 框 中 
输入 百 分 位 数 的 个 数 。 
。 比例 估算 : 系统 将 估计 与 特定 等 级 对 应 的 分 布 的 累积 比例 。 
。 正 态 得 分 : 系统 将 输出 对 应 于 估计 的 累积 比例 的 Z 得 分 。 


当选 中 了 “比例 估算 ”或 “ 正 态 得 分 ” 复 选 框 后 ，“ 比 例 估算 公式 ”选项 组 被 激活 ， 用 户 
可 以 选择 要 使 用 的 比例 估计 方法 。 

本 例 选 中 “ 秩 ” 复 选 框 。 

@ “ 绑 定 值 ”设置 。 单 击 “ 绑 定 值 ”按钮 ， 弹 出 如 图 2-60 所 示 的 “个 案 排 秩 : 绑 定 值 ” 
对 话 框 。 


由 个 过 排 秩 : 类 型 x 

| 加 百分比 分 数 秩 

回 萨 维 奇 得 分 (S) 是 个案 权 重 总 和 (C) 

回 分 数 排 序 E) 书 Ntles: 4 卜 个 宗 排 秩 : 绑 定 值 区 
- 分 配给 绪 定 值 的 秩 
ED GIES Of) Om 
ls Blom 加 终 坚 中 四 容 特 摘 人 CTY 〇 顺序 秩 到 唯一 值 S) 


图 2-59 “个 案 排 秩 : 类 型 ”对 话 杠 图 2-60 “个 案 排 秩 : 绑 定 值 ” 对 话 杠 
该 对 话 框 用 于 设置 对 等 级 取 值 相 同 的 观测 值 的 处 理 ， 共 有 以 下 4 种 方式 。 


。 平均 值 : 表示 以 等 级 的 平均 值 作为 最 终 的 结果 。 
。 低 : 表示 以 相同 等 级 的 最 小 值 作为 最 终 的 结果 。 
。 高 : 表示 以 相同 等 级 的 最 大 值 作为 最 终 的 结果 。 
。 顺序 秩 到 唯一 值 : 表示 把 相同 的 观测 值 作为 一 个 值 来 求 等 级 。 


本 例 要 求 成 绩 相同 者 名 称 并 列 ， 故 选中 “高 ” 单 选 按钮 。 
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@ 将 秩 1 赋予 。 该 选项 组 用 于 设置 等 级 的 排列 顺序 ， 最 小 值 表示 使 用 升序 ， 最 大 值 表示 
使 用 降序 ， 本 例 选 中 “最 大 值 ” 单 选 按钮 。 

@ 显示 摘要 表 。 如 选中 该 复 选 框 ， 在 结果 窗口 中 将 输出 分 析 的 摘要 信息 。 

4) 单 击 “ 确 定 ” 按 钮 ， 就 可 以 对 变量 取 值 求 等 级 。 个 案 等 级 排序 的 结果 如 图 2-61 所 示 。 


起 也 他 89 玫 丑 sav 著 深 舌 1] -IBM SPSS Statistics 数 和 宙 守 器 = [a] We 


[ TEN SPSS Statistics 外 更 程 床 站 二 | | |Unicode ON 


2-61 变量 等 级 排序 后 的 结果 


由 图 2-61 可 以 看 出 ， 变 量 的 等 级 作为 一 个 新 的 变量 “R 成 绩 ” 保 存 ， 这 个 变量 给 出 了 每 
个 学 生 的 排名 情况 ， 可 以 由 表格 中 第 13 一 15 行 看 出 ， 成 绩 相同 的 学 生 的 排名 是 并 列 的 。 


2.6.6 ”缺失 数据 的 处 理 


在 数据 分 析 的 过 程 中 ,多 种 情况 会 导致 缺失 值 的 产生 , 例如 某 一 年 的 观测 资料 丢失 , 缺失 
值 的 产生 会 给 数据 分 析 带 来 许多 问题 ， 这 种 情况 下 我 们 将 用 到 缺失 数据 处 理 的 功能 。SPSS 提 
供 了 多 种 手段 进行 缺失 值 的 替代 操作 。 本 节 以 人 均 GDP 的 计算 为 例 讲解 缺失 值 的 操作 ， 数 据 
文件 中 由 于 某 种 原因 , 没有 获得 1995 年 的 人 均 GDP 数据 (GDP 单位 : 亿 元 ， 人 均 GDP 单位 : 
元 ) ， 因 此 我 们 需要 对 缺失 值 进 行 合理 替代 以 便 进 行 相应 的 分 析 。 本 例 的 原始 数据 文件 如 图 


2-62 所 示 。 
缺失 值 蔡 代 的 操作 步骤 如 下 : 
1) 在 菜单 栏 中 选择 “转换 ”|“ 蔡 换 缺 失 值 ”命令 ， 打 开 如 图 2-63 所 示 的 “替换 缺失 值 ” 


2) 选择 要 蔡 换 缺失 值 的 变量 。 

选择 含有 缺失 值 的 变量 ， 单 击 国 按钮 将 其 先入 “新 变量 ”列表 框 中 ， 系 统 会 自动 生成 用 
于 替代 缺失 值 的 新 变量 。 如 果 用 户 希 望 自 定义 变量 名 称 ， 可 以 在 “名 称 ” 文 本 框 中 输入 自 定义 
变量 名 称 ， 然 后 单 击 “ 变 化 量 ” 按 钮 完成 设置 。 本 例 将 “人 均 GDP” 变 量 选 入 列表 框 中 ， 生 
成 后 的 新 变量 命名 为 “人 均 GDP 的 缺失 值 蔡 代 ”， 如 图 2-64 所 示 。 
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起 * 训 大玉 8 外 理 sav | 其 据 条 1] -IBM SPSS Statistics 数据 持 写 器 = 昔 x 


BM SPSS Stalistics 外 理 程序 名 堵 “| |Unicode ON | 
图 2-62 人 均 GDP 数据 ( 缺 1995 年 
内 昔 扩 缺失 值 X | | 外 zenx 介 x 
新 到 量 作 ): 到 这 里 员 : 
和 
2 Nscor 国 信人 9cDP 凶 
和 名称 和 方法 一 一 一 一 一 一 一 一 一 一 一 名 称 和 方法 
A Fk): 
第 近 点 明度 ; 叙 近 占 的 险 度 : 
会 提 伯 Lp: | 四 主角 L 鲜 执 值 (J): 了 | 全 全 部 册 
LE] sec EE EICHIETIEN 
图 2-63 “ 蔡 换 缺 失 值 ”对 话 框 图 2-64 选择 要 蔡 换 缺失 值 的 变量 


3) 选择 缺失 值 蔡 代 的 方法 。 
在 “方法 ”下 拉 列 表 中 选择 缺失 值 蔡 代 的 相应 方法 ， 有 以 下 几 种 方法 。 


。 序列 平均 值 : 系统 将 使 用 所 有 非 缺 失 值 的 平均 数 蔡 代 缺失 值 。 

。 临近 点 的 平均 值 : 系统 将 使 用 缺失 值 临近 的 非 缺 失 值 的 平均 值 替代 缺失 值 , 用 户 可 以 在 “ 附 
近 点 的 跨度 ”文本 框 中 定义 临近 非 缺 失 值 的 个 数 。 

。 临近 点 的 中 位 数 : 系统 将 使 用 缺失 值 临近 的 非 缺 失 值 的 中 位 数 普 代 缺失 值 ， 同 样 可 在 “ 附 
近 点 的 跨度 ”文本 框 中 定义 临近 非 缺 失 值 的 个 数 。 

。 线性 插值 法 : 系统 将 使 用 缺失 值 相 邻 两 点 的 中 点 处 的 取 值 替代 缺失 值 。 

。 点 处 的 线性 趋势 : 系统 将 采取 线性 拟 合 的 方法 确定 蔡 代 值 。 

本 例 选择 “序列 平均 值 ”选项 。 

4) 单 击 “确定 ”按钮 ， 就 可 以 完成 缺失 值 蔡 代 操 作 。 缺 失 值 蔡 代 的 输出 结果 如 图 2-65 所 示 。 
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| 站 -二 让 nt 理 sav [迷失 1] -IBM spss statitics 到 过 各 各 - 0O x 


TBN SPSS Siabstcs 外 更 程 序 沁 绩 | [unicodeON | 


图 2-65 进行 缺失 值 蔡 代 后 的 数据 


由 图 2-65 可 以 看 出 ，1995 年 的 缺失 值 已 经 有 替代 ， 保 存在 新 生成 的 “人 均 GDP 的 缺失 
值 蔡 代 ”变量 中 。 


2.7 ”数据 的 汇总 


数据 的 汇总 就 是 按 指 定 的 分 类 变量 对 观测 量 进行 分 组 并 计算 各 分 组 中 某 些 变量 的 描述 统 
计量 。 本 节 以 按 性 别 进行 成 绩 统计 为 例 ， 讲 解数 据 的 汇总 操作 ， 本 例 要 求 按 性 别 分 别 输出 数学 
和 物理 成 绩 的 均值 ， 以 此 分 析 不 同性 别 的 学 生 对 知识 的 掌握 程度 。 本 例 的 原始 数据 如 图 2-66 
所 示 。 


稚 -9rBLsav 区 要 1] -用 M Spss Statistics 下 曙 扣 各 
文件 下 ) 续 界 EE) 本 看 V) 数据 (D) 转换 CD 分 析出 消 人) 本 RHG) 天 用 程序 (W) 扩展 OO。 定 口 (WW) 帮助 时) 
EF 了 一 = 


| BU SPSS Statistics 外 理 程序 统 坟 |UnicodeON| | | 


图 2-66 未 进行 汇总 的 原始 数据 
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1) 在 菜单 栏 中 选择 “数据 ”|“ 汇 总 ”命令 ， 打 开 如 图 2-67 所 示 的 “汇总 数据 ”对 话 框 。 

2) 选择 分 类 变量 与 汇总 变量 。 

选择 分 类 变量 ， 单 击 国 按 钮 将 其 选 入“ 分界 变量 ”列表 框 ， 选 择 要 进行 汇总 的 变量 ， 单 
击 国 按 钮 将 其 先入 “变量 摘要 ”列表 框 ， 本 例 将 “性 别 ” 变 量 选 入 “分 界 变 量 ” 列 表 框 ， 将 
“数学 ”和 “物理 ”变量 选 入 “变量 摘要 ”列表 框 ， 如 图 2-68 所 示 。 


PT x Cr x 
界 交 里 昌 ): 
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RO) Si 

『 保存 保存 

本 各 室 于 括 动人 全 拒 所 二 水 0 天 动 直 所 系 (D) 

口 键入 总 到 的 亲 要 入 E) 口 亨 所 会所 的 让 扫 策 E) 

a De 

rashangSPSSI5 计 分 煌 从 入 | 本 | 傅 通 傅 六 “sgr sa [eu 4 anghsPss 枕 计 分 折 从 入 | 理 | 情 通 \ 源 六 ggr sev 
用 于 大 和 的 过 而 用 于 太吉 二 
文件 已 分界 突显 进 行 和 器 文件 忆 近 因 进 生 排序) 
CR 可 汇 各 文件 放行) 
[EE “区 全 [i ] MahE SEE mh Lu | 
2-67 “汇总 数据 ”对 话 框 2-68 分界 变量 与 变量 摘要 的 选择 

3) 设置 汇总 变量 。 
在 “变量 摘要 ”列表 框 中 选中 汇总 变量 ， 单 击 “ 函 数 ” 按 钮 ， 在 弹出 的 “汇总 数据 : 汇总 


函数 ”对 话 框 (如 图 2-69 所 示 ) 中 选择 汇总 函数 的 类 型 ， 单 击 “ 名 称 与 标签 ”按钮 ， 在 弹出 


的 “汇总 数据 : 变量 名 和 标签 ”对 话 框 〈 如 图 2-70 所 示 ) 中 设置 汇总 后 产生 的 新 变量 的 变量 
名 与 变量 标签 。 


起 ;Cewgs: 汇 S 卫 站 
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口 标准 短 B) 口服 大 值 Q9 。。。 口 未 加 要 喜 失 () 
百分比 、 分 数 和 计数 


旧 百 JP) 人 数 中。 9 计 教 虽 


图 2-69 “汇总 数据 : 汇总 函数 ”对 话 框 图 2-70 “汇总 数据 :变量 名 和 标签 ”对 话 框 
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如 果 用 户 希 望 在 新 变量 中 显示 每 个 类 别 中 的 观测 量 的 个 数 ， 可 以 选中 “个 案 数 ” 复 选 框 并 
在 其 后 的 “名 称 ” 文 本 框 中 输入 相应 变量 的 名 称 。 
本 例 输出 数学 和 物理 变量 的 平均 值 ， 分 别 命名 为 “数学 平均 成 绩 ” 和 “物理 平均 成 绩 ”。 


4) 进行 相应 的 设置 。 

Q@ “保存 ”设置 。 该 选项 组 用 于 设置 汇总 结果 的 保存 方式 。 

。 选中 “将 汇总 变量 添加 到 活动 数据 集 ” 单 选 按 钮 ， 系统 会 将 汇总 的 结果 保存 到 当前 数据 集 。 

。 选中 “创建 只 包含 汇总 变量 的 新 数据 集 ”， 系 统 将 创建 一 个 新 的 、 只 包含 汇总 变量 的 数据 
集 ， 用 户 可 以 在 “数据 集 名 称 ”文本 框 中 输入 新 数据 集 名 称 。 

。 选中 “创建 只 包含 汇总 变量 的 新 数据 文件 ”， 系 统 会 将 汇总 后 的 变量 保存 到 一 个 新 的 数据 
文件 。 本 例 选中 “将 汇总 变量 添加 到 活动 数据 集 ” 单 选 按 钮 。 

@ 适用 大 型 数据 集 的 选项 。 该 选项 组 用 于 设置 对 于 较 大 数据 集 的 处 理 方式 。 


。 “文件 已 按 分 界 变量 进行 排序 ” 复 选 框 ， 表 示 数 据 已 经 按照 分 组 变量 进行 了 排序 ， 系 统 将 
不 再 进行 排序 操作 。 
。 “汇总 前 对 文件 进行 排序 ”， 系 统 会 在 进行 汇总 前 按照 分 组 变量 对 数据 进行 排序 。 本 例 选 
中 “文件 已 按 分 组 变量 排序 ” 复 选 框 。 
5) 单 击 “ 确 定 ”按钮 ， 就 可 以 进行 汇总 操作 。 
图 2-71 即 为 按 性 别 汇总 后 的 数据 文件 , SPSS 分 别 给 出 了 男生 和 女生 的 数学 与 物理 成 绩 的 
均值 ， 并 作为 新 变量 保存 在 数据 文件 中 。 


| @ Ce av NRGR1] IBM SpSS Statistics 和 过 司 碌 
Ee 关 拆 站 所 W， 再 测 册 ERMG) 天 有 各 FU 扩 归 0 再 GD。 更 t) 
Et f mn 


EN 遇 到 芭 训 公国 


BM SPSS Stafisiics 外 理 程 怀 络 | 。 [UnicodeON | 


图 2-71 汇总 后 的 数据 文件 


2.8 数据 文件 的 结构 重组 


不 同 的 分 析 方 法 需要 不 同 的 数据 文件 结构 , 当 现 有 的 数据 文件 结构 与 将 要 进行 的 分 析 所 要 
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求 的 数据 结构 不 一 致 时 , 我 们 需要 进行 数据 文件 的 结构 重组 。 一般 来 说 , 数据 文件 的 结构 分 为 
横向 与 纵向 两 种 结构 。 

1. 横向 结构 

横向 结构 的 数据 将 一 个 变量 组 中 的 不 同 分 类 分 别 作为 不 同 的 变量 , 例如 , 在 示例 数据 中 将 
施用 不 同化 肥 下 的 作物 产量 分 别 作为 一 个 变量 进行 保存 ， 每 一 个 试验 组 是 一 个 观测 量 ， 如 图 
2-72 所 示 。 

2. 纵向 结构 

纵向 结构 的 数据 将 一 个 变量 组 中 的 不 同 分 类 分 别 作为 不 同 的 观测 量 , 例如 , 在 示例 数据 中 
将 每 一 个 试验 组 在 不 同 肥 料 作用 下 的 产量 分 别 作为 一 个 观测 量 ， 如 图 2-73 所 示 。 

本 节 以 施用 不 同类 型 肥料 的 情况 下 作物 的 产量 为 例 讲解 数据 文件 的 结构 重组 ， 图 2-72 和 
2-73 给 出 了 该 数据 文件 的 两 种 不 同 的 保存 方式 。 
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图 2-72 数据 文件 的 横向 结构 图 2-73 数据 文件 的 纵向 结构 (产量 单位 : 千克 / 亩 ) 


2.8.1 ”数据 重组 方式 的 选择 Saas 


次 迎 使 用 " 重 构 数据 向 导 "! 


在 菜单 栏 中 选择 “数据 ” | “ 重 构 ” 命令 ， 打开 pd 后 之 刘 然 , 您 所 
如 图 2-74 所 示 的 “ 重 构 数据 向 导 ” 对 话 框 。 @® mi ms name, 

该 对 话 框 提供 了 3 种 数据 重组 方式 ， 分 别 是 
“将 选 定 变量 重 构 为 个 案 ”“ 将 选 定 个 案 重 构 为 变 = 
量 ”和 “ 转 置 所 有 数据 ”， 用 户 可 以 根据 现 有 数据 = 
的 组 合 方式 和 将 要 进行 的 分 析 来 选择 相应 的 数据 2 
重组 方式 。 


如 率 委 对 相关 个 案 组 进行 和 新 安排 ， 以 全 特 屁 个 组 
Eire 


口 转 于 所 有 数据 上 
所 有 个 宁 孝 灾 为 交 旱 ， 而 所 过 立时 村 为 亲 数据 
人 


2.8.2 ”由 变量 组 到 观测 量 组 的 重组 


变量 组 到 观测 量 组 的 重组 将 会 使 数据 由 横向 


格式 转换 为 纵向 格式 , 首先 打开 横向 格式 保存 的 数 
据 文 件 ， 如 图 2-72 所 示 。 2-74 “ 重 构 数据 向 导 ” 对 话 框 
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1) 选择 变量 组 个 数 。 

在 图 2-74 所 示 的 “ 重 构 数据 向 导 ” 对 话 框 中 选中 “将 选 定 变量 重组 为 个 案 ” 单 选 按钮 ， 
单 击 “ 下 一 步 ” 按 钮 ， 弹 出 如 图 2-75 所 示 的 “ 重 构 数据 向 导 一 第 2/7 步 ” 对 话 框 ， 

在 该 对 话 框 中 选择 要 重组 的 变量 组 的 个 数 。 因为 本 例 只 有 施肥 类 型 一 个 变量 组 , 所 以 选中 
“一 个 ” 单 选 按钮 。 

2) 选择 要 重组 的 变量 。 

单 击 “ 下 一 步 ” 按 钮 ， 弹 出 如 图 2-76 所 示 的 “ 重 构 数据 向 导 一 第 3/7 步 ” 对 话 框 。 


二 Ba 号 - 更 217 纺 


x EP x 
变 营 到 个 案 : 变 重 组 数 日 es 选择 变 营 Ee 
前 雪 押 中 的 届 十 变量 组 ， 重 构 后 8 文件 中 部会 有 一 个 目 村 变量 。 
be 中 9 相关 个 这 组 。 
一 但 关 实生 (种 为 0 量 组) 来 未 一 个 到 量 的 各 个 于 结果 a 于 和 此 到 量 雪 于 个 里 量 
M0， 菇 时 本 以 是 贡 度 如 了 使用 三 个 单 折扣 生 站 末末 记录 比 里 ， 并 且 每 个 时 寺 末 另外 全 开本 以 计 冯 要 作为 本 所 利于 新 文人 的 安 鲁 
和 5 导向 所 安 六 在 一 绝 里 中 * 
如 果 文 件 中 存在 多 个 交 重 ， 那 通常 它 也 记 姑 在 冯 重 如 中 ， 例 ip 记 录 在 h1、h2 和 h3 中 的 当前 文件 中 的 交 昌 (Ch 
2 aa ARNA] 
eT 地 
区 全 用 有 HE 产量 HE 
四 Ri 作用 肥 HC 产 年 喝 时 
malad 本 wi 
cacy 图 
Baa 加 
目 
号 
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日 名 个 (M0， Wl, we 和 WG 以 及 1、 hz 和 M3 等 尘 
A 


En" 


(Eis (ES) 世 劲 机- 
图 2-75 “ 重 构 数据 向 导 一 第 2/7 步 ”对 话 框 图 2-76 “ 重 构 数据 向 导 一 第 3/7 步 ” 对 话 框 
@ “个 案 组 标识 ”选项 组 。 该 选项 组 用 于 设置 对 观测 记录 的 标识 变量 ， 在 下 拉 列 表 框 中 
有 3 个 选择 项 : 


使 用 个 案 号 ， 选 择 此 项 系统 会 出 现 “ 名 称 ”文本 框 和 “标签 ”列表 ， 用户 可 以 设置 重组 后 
序号 变量 的 变量 名 和 变量 标签 。 

。 使 用 选 定 变量 ， 选 择 此 项 系统 会 出 现 一 个 国 按 钮 和 “变量 ”列表 ， 选 择 标识 变量 ， 单 击 

国 按钮 将 其 先入 “变量 ”列表 框 即 可 。 

。 无 ， 表 示 不 使 用 标识 变量 。 

@ “要 转 置 的 变量 ”选项 组 。 该 选项 组 用 于 设置 需要 进行 变换 的 变量 组 。“ 目 标 变量 ” 
下 拉 列 表 框 用 于 指定 要 进行 重组 的 变量 组 。 指 定 完成 后 ， 选 择 相应 变量 ， 单 击 国 按 钮 将 其 先 
入 “目标 变量 ”列表 框 ， 组 成 要 变换 的 变量 组 。 

图 “固定 变量 列表 框 。 如 果 用 户 不 希望 一 个 变量 参加 重组 , 只 需要 选择 该 变量 , 单 击 国 
按钮 将 其 选 入 “固定 变量 ”列表 框 即 可 。 

本 例 将 “肥料 A”“ 肥 料 B” 和 “肥料 C” 变量 选 入 “要 变换 的 变量 ”列表 框 ， 在 “目标 
变量 ”后 的 文本 框 中 输入 “产量 ”。 

3) 选择 索引 变量 的 个 数 。 

单 击 “ 下 一 步 ”按钮 ， 弹 出 如 图 2-77 所 示 的 “ 重 构 数据 向 导 一 第 4/7 步 ”对 话 框 。 
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该 对 话 框 用 于 设置 重组 后 生成 的 索引 变量 的 个 数 ， 可 以 选择 一 个 或 多 个 ， 也 可 以 选择 无 ， 
表示 把 索引 信息 保存 在 某 个 要 变换 重组 的 变量 中 ,不 生成 索引 变量 。 本 例 选择 创建 “一 个 ” 索 
引 变量 。 

4) 设置 索引 变量 的 参数 。 

继续 单 击 “ 下 一 步 ” 按 钮 ， 弹 出 如 图 2-78 所 示 的 “ 重 构 数据 向 导 一 第 5/7 步 ” 对 话 框 。 


起 本 gare 向 呈 - 第 4/7 步 Se 起 BaimP 呈 -把 517 步 

变 生 到 个 案 ; 创建 索引 变 生 变 芝 到 个 案 : 创建 一 个 索引 变 芝 

在 当前 数据 中 ， 训 多 组 的 值 在 单个 个 泰 中 的 闻 十 奖 量 中 出 现 * 例 各 ， 单 个 个 案 包 全 w1 、w2 和 w3 您 已 这 振 国 建 一 个 过 引 诡 量 。 此 详 重 的 值 可 以 是 连 媒 孝 字 ， 记 司 以 是 组 中 各 个 交 便 的 名 称 。 

在 天 中 ， 念 可 以 指定 合 引 交 量 89 名 种 和 标 兰 。 

在 种 堵 扣 中 ， 贡 重组 约 值 将 在 多 个 个 淋 丰 的 单个 贡 量 中 出 现 。 例 各 ,将 有 三 个 个 案 ， 同 wi w2 
中 各 四 5 的 个。 
ri 用 干 标识 横 据 看 蛤 个 素 B 汗 的 新 个 素 组 例如， 名 为 "wE9 索 引 符 具有 午 1 于 引信 具有 什 分 安 到 和 
Oz) 
案 引 伟人 D): 23 
BOT Om 
| ES . 
et 处 理 机 条 件 和 公克 ， 本 使 用 此 ee 
EE | [3 E21 要 引导 
ec ar 5 Ta 
全 四 | ~ 处 理 或 亲 件 的 对 应 ， 汪 使 几 比 
人 四 次 
Pe | 
用 此 区 能 
ET ES 3、 
图 2-77 “ 重 构 数据 向 导 一 第 4/7 步 ”对 话 框 2-78 “ 重 构 数据 向 导 一 第 5/7 步 ”对 话 框 


。 “索引 值 具 有 什么 类 型 ”选项 组 : 该 选项 组 用 于 设置 索引 值 的 类 型 ， 用 户 可 以 选择 连续 数 
字 或 变量 名 作为 索引 值 的 类 型 。 
。 “编辑 索引 变量 名 和 标签 ” 栏 : 在 该 栏 中 设置 索引 变量 的 变量 名 和 变量 标签 。 
本 例 设置 索引 变量 的 名 称 为 “施肥 类 型 ”，“ 索 引 值 ”为 变量 名 ， 即 “肥料 A、 肥 料 B、 
肥料 C”。 
5) 其 他 参数 的 设置 。 
单 击 “ 下 一 步 ”按钮 ， 弹 出 如 图 2-79 所 示 的 “ 重 构 数据 向 导 一 第 6/7 步 ” 对 话 框 。 


@ “未 选择 的 变量 的 处 理 方式 ”选项 组 。 该 选项 组 用 于 设置 对 用 户 未 选 定 变量 的 处 理 方 
式 ， 如 选中 “从 新 数据 文件 中 删除 变量 ” 单 选 按 钮 ， 系 统 会 将 这 一 部 分 变量 删除 ， 如 选中 “ 保 
留 并 作为 固定 变量 处 理 ” 单 选 按钮 ， 系 统 会 将 这 一 部 分 变量 作为 固定 变量 处 理 。 

@ “所 有 转 置 后 的 变量 中 的 系统 缺失 值 或 空 值 ”选项 组 。 该 选项 组 用 于 设置 对 要 变换 变 
量 中 的 缺失 值 和 空白 值 的 处 理 方式 ， 如 选中 “在 新 文件 中 创建 个 案 ” 单 选 按钮 ， 表 示 系 统 将 为 
这 些 变量 单独 生成 观测 记录 ; 如 选择 “废弃 数据 ” 单 选 按钮 ， 则 这 一 部 分 观测 值 将 被 删除 。 

@@ “个 案 计数 变 量 ”选项 组 。 该 选项 组 用 于 设置 是 否 生成 计数 变量 ， 选 中 “计算 由 当前 
数据 中 的 个 案 创建 的 新 个 案 的 数目 ” 复 选 框 ， 表 示 生 成 计数 变量 ， 同 时 将 激活 “名 称 ” 和 “ 标 
签 ”文本 框 ， 用 户 可 以 在 其 中 输入 计数 变量 的 变量 名 和 变量 标签 。 在 本 例 中 ， 该 步 保 持 默认 设 
置 即 可 。 


6) 完成 数据 重组 。 
单 击 “ 下 一 步 ” 按 钮 ， 弹 出 如 图 2-80 所 示 的 “ 重 构 数据 向 导 一 完成 ”对 话 框 。 
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图 在 新 文件 中 创建 个 案 E) 
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本 向 写生 法 机 到 清 法 窗口 中 人) 
个 案 计 吉 量 ] 如 果 您 宁 望 先 保存 或 信 避 语法 隔 重 父 归 据 ， 请 使 用 此 功能 ， 


] 计 其 由 当前 扒 所 中 的 个 幸 人 的 新 个 志 的 扫 目 (C) 


Es = 
图 2-79 “ 重 构 数据 向 导 一 第 6/7 步 ”对 话 框 2-80 “ 重 构 数据 向 导 一 完成 ”对 话 框 
这 里 可 选择 是 否 立 即 进行 数据 重组 ， 如 选中 “将 本 向 导 生成 的 语法 粘贴 到 语法 窗口 中 ” 单 
选 按钮 ， 系 统 会 将 相应 的 命令 语句 粘贴 至 语句 窗口 。 

设置 完成 后 ， 单 击 “ 完 成 ”按钮 即 可 进行 数据 重组 操作 。 重 组 后 的 数据 文件 如 图 2-73 所 
示 ， 横 向 格式 的 数据 文件 转换 成 了 纵向 格式 的 数据 文件 。 


2.8.3 ”由 观测 量 组 到 变量 组 的 重组 


观测 量 组 到 变量 组 的 重组 使 数据 由 纵向 格式 转换 为 横向 格式 ， 步 骤 如 下 。 
1) 选择 重组 变量 。 在 图 2-74 所 示 的 “ 重 构 数据 向 导 ” 对 话 框 中 选中 “将 选 定 个 案 重 组 为 
变量 ” 单 选 按钮 ， 单 击 “ 下 一 步 ” 按 钮 ， 弹 出 如 图 2-81 所 示 的 “ 重 构 数据 向 导 一 第 2/5 步 ” 


| 二 39 了 汪 -第 215 泌 x 


个 案 到 变量: 选择 变 重 
关 当 前 文件 中 的 个 末次 近 重 术 为 新 文 人 中 的 部 个 个 党 > 
请 间 过 检 实 量 移 至 " 煌 识 自重 列表 来 先 攻 于 标识 个 雪 反 区 逾 。 呈 外 ， 你 这 可 以 先入 人 引 到 量 … 


EC [| 
凶 
[3 
BE 


2-81 “ 重 构 数据 向 导 一 第 2/5 步 ”对 话 框 
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从 “当前 文件 中 的 变量 ”列表 框 中 选择 在 重组 后 将 在 数据 集中 标识 观测 记录 的 变量 , 单 击 
国 按 钮 将 其 选 入 “标识 变量 ”列表 框 ， 选 择 构成 新 数据 集中 变量 组 的 变量 ， 单 击 国 按 钮 将 其 
选 入 “索引 变量 ”列表 框 。 

本 例 将 “观测 组 ”变量 选 入 “标识 符 变量 ”列表 框 ， 将 “产量 ”变量 选 入 “索引 变量 ” 列 
表 框 。 

2) 原始 数据 的 排序 设置 。 单 击 “ 下 一 步 ”按钮 ， 弹 出 如 图 2-82 所 示 的 “ 重 构 数据 向 导 一 
第 3/5 步 ”对 话 框 。 

该 对 话 框 用 于 设置 是 否 对 原始 数据 进行 排序 ， 选 中 “是 ” 单 选 按钮 ， 系 统 会 在 数据 重组 之 
前 按照 标识 变量 对 原始 数据 进行 排序 ; 选中 “ 否 ” 单 选 按钮 , 则 不 进行 此 项 操作 。 本 例 选中 “是 ” 
单 选 按钮 。 

3) 新 变量 的 相关 参数 设置 。 单 击 “ 下 一 步 ” 按 钮 ， 弹 出 如 图 2-83 所 示 的 “ 重 构 数据 向 导 
一 第 4/5 步 ” 对 话 框 。 


起 弄 败 到 内 导 -第 3/5 步 X | | 全 om- 全 415 沙 x 
个 案 到 变 最: 数据 排序 个 案 到 变量 : 选项 
Erb 在 比 沙 寺中 ， 全 以 说 届 要 应 用 于 重 构 后 入 件 的 过] 需 。 


新区 时 起 9 下 
图 技 限 抽 突 欠 和 分 如 《例如 : wi w2 w3.h1h2h3) (G) 
人吉 于 二 日 按 索引 分 姐 (多 hn: win1.w2 nz w3h3) @) 

四 加 TH 


个 案 计 数 到 里 
站 计 莽 当前 数据 中 用 未 8 时 新 个 当 的 个 案 数 (C) 
BR 


ella 


指示 行 交 从 
站 创建 指示 从 交 鲁 (E) 
Wy nd 


EE 并 Ee 

图 2-82 “ 重 构 数据 向 导 一 第 3/5 步 ” 对 话 框 2-83 “ 重 构 数据 向 导 一 第 4/5 步 ”对 话 框 

。 “新 变量 组 的 顺序 ”选项 组 : 用 于 设置 新 变量 组 中 变量 的 排序 方式 ， 有 “ 按 原始 变量 进行 
分 组 ”和 “ 按 索引 分 组 ”两 种 。 

。 “个 案 计 数 变 量 ”选项 组 : 设置 是 否 生 成 计数 变量 ， 如 选中 “计算 当前 数据 中 用 来 创建 新 
个 案 的 个 案 数 ” 复 选 框 ， 则 表示 生成 计数 变量 ， 同 时 激活 “名 称 ” 和 “标签 ”文本 框 ， 用 
户 可 以 在 其 中 输入 计数 变量 的 变量 名 和 变量 标签 。 

。 “指示 符 变量 ”选项 组 : 设置 是 否 生成 指示 变量 ， 选 中 “创建 指示 符 变 量 ” 复 选 框 ， 表 示 
对 索引 变量 的 每 个 取 值 生成 一 个 指示 变量 ， 用 于 记录 对 应 的 变量 取 值 是 否 为 空 值 ， 用 户 可 
以 在 “ 根 名 ”文本 框 中 输入 指示 变量 的 前 级 。 

本 例 选择 默认 设置 即 可 。 

4) 完成 数据 重组 。 继 续 单 击 “ 下 一 步 ”按钮 ， 弹 出 “ 重 构 数据 向 导 一 完成 ”对 话 框 。 
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2.8.4 “变换 重组 


在 图 2-74“ 重 构 数据 向 导 ” 对 话 框 中 选中 “ 转 置 所 有 数据 ” 单 选 按钮 ， 单 击 “ 完 成 ” 按 
钮 ， 则 弹出 如 图 2-31 所 示 的 “ 转 置 ”对 话 框 。 

该 对 话 框 的 形式 和 设置 方式 与 2.5.4 节 “ 数 据 文件 的 变换 ”中 完全 相同 ， 读 者 可 以 参考 该 
节 ， 在 此 不 再 獒 述 。 


2.9 读 取 其 他 格式 文件 数据 


在 现实 的 分 析 应 用 中 ,许多 数据 并 不 是 以 SPSS 数据 格式 保存 的 ， 因 此 我 们 需要 能 够 读 取 
这 些 不 同 格式 的 数据 文件 。SPSS 提供 了 与 多 种 应 用 软件 的 接口 ， 支 持 多 种 格式 的 数据 文件 ， 
用 户 可 以 很 方便 地 将 其 他 格式 的 数据 文件 导入 其 中 。 
2.9.1 读 取 Excel 软件 文件 ( .xls ) 


Excel 是 当前 常用 的 电子 表格 软件 之 一 ，SPSS 提供 了 相应 的 程序 接口 ， 使 用 户 可 以 方便 
地 把 Excel 电子 表格 中 的 数据 读 入 SPSS 数据 编辑 器 中 。 Excel 文件 的 数据 显示 如 图 2-84 所 示 。 


加 := 很 ” 


a nH | 
I 油料 鱼 村 
2.2 0.0 


2-84 ”Excel 文件 
读 取 Excel 数据 的 具体 操作 如 下 。 


1) 在 菜单 栏 中 选择 “文件 ”|“ 打 开 ”|“ 数 据 ” 命 令 ， 打 开 如 图 2-85 所 示 的 “打开 数据 ” 
2) 在 “文件 类 型 ”下 拉 列 表 框 中 选择 “Excel (*.xls，*.xlsx，*.xlsm) ”选项 ， 打 开 要 读 
入 的 Excel 文件 ， 如 图 2-86 所 示 。 
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x 


文件 各): ] 国 丙 ) HE: Came ] 
ET we)| xasn: [Ecom) 司 Gwe 
WE | | vw: | 
me Cd | 
本 G9 
2-85 “打开 数据 ”对 话 框 2-86 选择 一 个 .xls 文件 


3) 进行 相应 的 设置 。 


单 击 “ 打 开 ” 按 钮 ， 弹 出 如 图 2-87 所 示 的 “ 读 取 Excel 文件 ”对 话 框 。 
。 “工作 表 ” 下 拉 列 表 框 : 如 果 读 取 的 Excel 数据 文件 中 有 多 个 数据 表 ， 用 户 可 以 在 该 下 拉 


列表 框 中 选择 要 读 取 的 工作 表 。 


。 “范围 ”文本 框 : 如 果 用 户 希望 读 取 Excel 工作 表 中 的 部 分 数据 ， 可 以 在 该 文本 框 中 输入 


相应 的 数据 范围 。 


。 “从 第 一 行 数据 中 读 取 变量 名 称 ” 复 选 框 : 如 选中 该 复 选 框 ， 系 统 会 将 Excel 数据 文件 的 


第 一 行 作为 变量 名 读 入 。 


4) 设置 完成 后 ， 单 击 “ 确 定 ” 按 钮 即 可 读 入 Excel 数据 。 读 入 后 的 结果 如 图 2-88 所 示 。 


国 R Excel 广 伯 x 


起 “和 Exceltr sv Mp1] -IBM SPSS Statistics WER 
本 看 QU) 执 据 人 Q) 靖 神 中 分析 W) 


- 0O x 


CiUsarsishangiSPSs 接 计 分 析 从 入 门 哺 冯 钳 广 件 证 
I 人 ffR(O: 


: 针 入 Excs 枉 覃 ds 


EE 


园 用 于 诡计 扫兴 型 89 寺 所 占 的 百分比 [E): |35 


于 所 有 数据 ， 并 且 可 滋 不 同 于 拉 上 内 容 ， 后 者 基于 粗 200 个 数据 和 家 


最 上 的 委 氢 基于 
览 公示 前 500 个 到 * 


和 的 MU 提 暑 @)_ 实 网 竹 订 WW) 扩展 C0。 而 DG 部 她 () 


OM SPSS Satstcs 外 于 六 二 |UnicoGe ON| | 


图 2-87 


229 忆 


“ 读 取 Excel 文件 ”对 话 框 
读 取 固定 格式 的 文本 文件 


2-88 读 入 SPSS 的 Excel 数据 


固定 格式 的 文本 文件 要 求 不 同 的 观测 数据 之 间 的 变量 数目 、 排 列 顺序 、 变 量 取 值 长 度 固定 
不 变 ， 如 图 2-89 所 示 为 一 个 固定 格式 的 文本 文件 。 


1) 在 菜单 栏 中 选择 “文件 ”|“ 打 开 ”|“ 数 据 ” 命 令 ， 打开 “打开 数据 ”对 话 框 。 


61 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


2) 在 “文件 类 型 ”下 拉 列 表 框 中 选择 “文本 格式 (*.txt， 
*.dat) ”选项 ， 打 开 要 读 入 的 文本 文件 。 

3) 打开 文本 导入 向 导 。 

单 击 “ 打 开 ” 按 钮 ， 弹 出 如 图 2-90 所 示 的 “文本 导入 向 
导 一 第 1/6 步 ”对 话 框 。 

用 户 可 以 选择 预定 义 的 格式 ， 也 可 以 在 向 导 中 创建 新 格 
式 ， 本 例 选 中 “和 否 ” 单 选 按钮 。 

4) 设置 文本 格式 。 

单 击 “ 下 一 步 ” 按 钮 ， 弹 出 如 图 2-91 所 示 的 “文本 导入 
向 导 一 第 2/6 步 ” 对 话 框 ， 这 里 有 两 个 选项 需要 设置 。 


| 轩 tvevtot-.. 一口 
= 饲 污 [日 雁 式 (0O) 查看 (V) 姑且 (H) 
1990 8424 4299 4125 6846 1578 


1991 8534 4352 4182 6884 1650 
1992 8580 4373 4207 6819 1761 
1993 8620 4392 4228 6724 1896 
574 


多 3089 六 沪 es 2634 
3 9108 5 28: 
En 9163 多 3 Bi 2951 


党 


2-89 固定 格式 的 文本 文件 


熏 下 导入 站 导 - 第 1/6 护 x | 国文 FS 和 辣 导 -第 215 步 


到 里 如 僻 排列 9 


证 界 多量 由 特定 字 生 (用 开 S 各 人 表 符 ) 定 界 。 


|1990 8424 4299 4125 5846 1578 
|1991 8534 4352 4182 5884 1650 
1992 8580 4373 4207 6819 1761 

993 8620 4392 4228 5724 1995 


图 2-90 “文本 导入 向 导 一 第 1/6 步 ”对 话 框 2-91 


[Et [Eu ee 
“文本 导入 向 导 一 第 2/6 步 ”对 话 框 


x 


。 变量 如 何 排列 : 定制 读 入 的 文本 文件 的 格式 。 如 选中 “ 定 界 ” 单 选 按钮 ， 则 表示 读 入 的 是 


自由 格式 的 文本 文件 ; 如 选中 “固定 宽度 ” 单 选 按钮 ， 


件 ， 本 节 主要 讲解 固定 格式 文本 文件 的 读 取 ， 故 选中 “固定 宽度 ” 单 选 按钮 。 
。 文件 开头 是 否 包括 变量 名 : 如 果 源 文件 中 包含 变量 名 ， 选 中 “是 ” 单 选 按钮 ， 系 统 会 将 变 


量 名称 读 入 ; 
不 包含 变量 名 ， 故 选中 “和 否 ” 单 选 按钮 。 
5) 进行 观测 量 的 相应 设置 。 


则 表示 读 入 的 是 固定 格式 的 文本 文 


如 果 源 文件 中 不 包含 变量 名 ， 选 中 “和 否 ” 单 选 按钮 。 本 例 由 于 原始 文本 文件 


单 击 “ 下 一 步 ”按钮 ， 弹 出 如 图 2-92 所 示 的 “文本 导入 向 导 一 定 界 ， 第 3/6 步 ” 对 话 框 。 
。 “第 一 个 数据 个 案 从 哪个 行 号 开始 ”微调 框 : way 如 果 数 据 文件 


中 包含 标签 ， 那 么 该 数据 文件 的 起 始 行 就 不 是 第 一 
< 


。 “个 案 的 表示 方式 如 何 ” 选 项 组 : 用 于 设置 表示 个 案 的 方式 ， 可 以 每 一 行 表示 一 个 个 案 ， 


也 可 以 用 特定 的 编号 表示 一 个 个 案 。 
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息 文本 导入 向 导 - 定 界 , 徐 316 步 
| 

个 村 的 雪 示 方式 zf? 

和 每 一行 表示 一 个 个 来 (L) 

加 交 量 的 村 十 坑 号 来 示 一 个 人 入 5 国 


要 导入 儿 少 个 来? 
加 全 部 个 过 四) 
ORD 0 个 人 要。 
问 陆 机 百分比 的 个 哥 (近似值) (P): 1 下 


1991 8534 4352 4182 6884 1550 
1992 8580 4373 4207 6819 1761 
1993 8620 4392 4228 6724 1896 


2-92 “文本 导入 向 导 一 定 界 ， 第 3/6 步 ”对 话 框 


。 “要 导入 多 少 个 案 ” 选 项 组 : 用 于 设置 导入 个 案 的 数量 。 如 选中 “全 部 个 案 ” 单 选 按钮 ， 
系统 将 把 所 有 观测 量 导 入 ; 如 选中 “前 (T) 个 个 案 ” 单 选 按钮 ， 系 统 会 导入 从 第 一 个 观测 到 
用 户 定义 位 置 的 所 有 观测 量 ; 如 选中 “随机 百分比 的 个 案 ” 单 选 按钮 ， 系 统 将 随机 导入 用 
户 指定 百分比 的 观测 量 。 本 例 选 中 “全 部 个 案 ” 单 选 按钮。 


6) 设置 变量 起 始点 。 

单 击 “ 下 一 步 ”按钮 ， 弹 出 如 图 2.93 所 示 的 “文本 导入 向 导 一 定 界 ， 第 4/6 步 ”对 话 框 。 

该 对 话 框 用 于 设置 从 数据 文件 读 取 变量 数据 的 方式 。 选 择 变量 之 间 的 定 界 符 , 选中 “空格 ” 
复 选 框 ， 系 统 将 根据 用 户 指定 的 定 界 符 来 划分 数据 。 

7) 设置 变量 名 称 和 数据 格式 。 

单 击 “ 下 一 步 ”按钮 ， 弹 出 如 图 2-94 所 示 的 “文本 导入 向 导 一 第 5/6 步 ” 对 话 框 。 


网 文 不 导入 向 导 - 定 办, 策 4/6 步 X | | 重文 F9 和 9- 犁 5/6 步 六 
实 里 之 则 存在 唱 些 定 界 行 ? 一 在 数据 十 此 中 造反 的 安 量 的 指证 顺 
日 失 D Y 实时 名 0W): 原 蛤 名称: 
Eine Ts " 
= 雪村 式 D): 
前 号 空格 和 怀 部 空格 


2-93 “文本 导入 向 导 一 定 界 ， 第 4/6 步 ”对 话 框 图 2-94 “文本 导入 向 导 一 第 5/6 步 ”对 话 杠 
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该 对 话 框 用 于 设置 变量 名 和 数据 格式 ， 起 二 SARS- 丙 06 罗 x 
在 “数据 预览 ”表格 中 选择 相应 的 变量 ， 即 
可 在 “变量 名 ”文本 框 中 输入 变量 名 称 ， 在 
“数据 格式 ”下 拉 列 表 框 中 选择 相应 的 数据 
格式 。 

8) 完成 读 取 。 

最 后 单 击 “ 下 一 步 ”按钮 , 弹出 如 图 2-95 
所 示 的 “文本 导入 向 导 一 第 6/6 步 ” 对 话 框 。 

如 果 用 户 希 望 将 本 次 设置 的 文件 格式 作 
为 规则 保存 ， 以 便 在 导入 类 似 的 文本 数据 文 
件 时 无 须 重新 设置 ， 可 以 在 “您 要 保存 此 文 


“是 ” 单 选 按钮 并 在 其 后 的 文本 框 中 输入 文 

件 的 保存 路 径 。 图 2-95 “文本 导入 向 导 一 第 6/6 步 ” 对 话 框 
设置 完成 后 ， 单 击 “ 完 成 ”按钮 即 可 实现 固定 格式 文本 数据 的 读 取 ， 图 2-89 文件 读 取 的 

结果 如 图 2-96 所 示 。 


起 ,天 本 2 网 可 和 1] -INM SPSS statistics 类 天 而 机 - OO 
REED 


[EM SPSS Staatcs 地 生得 订 如 纤 | [unicode ON 


图 2-96 读 入 SPSS 的 固定 格式 文本 文件 


2.9.3 ” 读 取 自由 格式 的 文本 文件 


自由 格式 的 文本 文件 要 求 不 同 的 观测 数据 之 间 的 变 [omc 
量 数目 、 排 列 顺序 一 定 ， 变 量 取 值 长 度 可 以 不 同 。 此 外 ， | 文 # 编 疆 日 格式 (o) 查看 V) 帮助 (H) 
与 固定 格式 的 文本 文件 不 同 ， 自 由 格式 的 文本 文件 的 数 8 和 4 人 0 307 32832 
据 项 之 间 必 须 有 分 隔 符 ， 如 图 2-97 所 示 。 i 人 tt 

1) 在 菜单 栏 中 选择 “文件 ”| “打开 ”| “数据” 命 
令 ， 打 开 “ 打 开 数据 ” 对话 框 。 图 2-97 自由 格式 的 文本 文件 
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2) 在 “文件 类 型 ”下 拉 列 表 框 中 选择 “ 文 。[aanme an soy 
本 格式 (*.txt，*.dat) ”选项 ， 打 开 要 读 入 的 
自由 格式 文本 文件 。 

3) 单 击 “ 打 开 ” 按 钮 ， 输 入 文本 导入 向 导 。 

4) 设置 文本 格式 。 在 图 2-91 所 示 的 “ 文 
本 导入 向 导 一 第 2/6 步 ” 中 选择 变量 的 排列 方 
式 为 “ 定 界 ”。 

5) 进行 观测 量 的 相应 设置 。 

6) 定制 分 隔 符 与 限定 符 。 如 图 2-98 所 示 
的 “文本 导入 向 导 一 定 界 , 第 4/6 步 ”对 话 框 。 


。 “变量 之 间 存 在 哪些 定 界 符 ” 选 项 组 : 
用 于 指定 文件 中 数据 之 间 的 分 隔 符 。 系 PT" CH) 
统 提供 了 制 表 符 空格 去 号 和 分 号 作 ”图 2.98 “文本 导入 向 导 一 定 界 ， 第 416 步 ”对 话 杠 
为 选择 ， 用 户 也 可 以 自 定义 一 个 符号 作 
为 分 隔 符 。 本 例 原始 文件 使 用 逗号 分 隔 ， 故 选中 “逗号 ” 复 选 框 。 
。 “文本 限定 符 是 什么 ”选项 组 : 用 于 设置 文本 限定 符 。“ 无 ”， 表 示 不 使 用 文本 限定 符 ; 
用 户 可 以 选择 单 引 号 或 双 引 号 作为 文本 限定 符 ， 用户 也 可 以 自 定义 文本 限定 符 。 本 例 选 中 
“无 ” 单 选 按钮 ， 没 有 限定 。 
7) 设置 变量 名 称 和 数据 格式 。 
8) 完成 读 取 。 设 置 完成 后 ， 单 击 “ 完 成 ”按钮 即 可 实现 自由 格式 文本 数据 的 读 取 。 读 入 
SPSS 的 自由 格式 的 文本 文件 如 图 2-99 所 示 。 
图 * 无 标题 2 [数据 集 1] - IBM SpSS Statistics 数据 六 名 里 一 口 
文件 器。 篇幅 E) ”查看 WW) 数据 CQ) 转 的 中 分析 (&) 直 消 册 ) 图 (SG) ”实用 程序 (J) 扩展 &) 窗口 QW) 才 助 HH) 
名 同和 久 园 一 茵 世 忆 


[ JIBM SPSS Staistics 处 更 得 序 绪 | | UnicodeON| | | 


2-99 读 入 SPSS 的 自由 格式 的 文本 文件 
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2.10 上 机 题 


mmf: vie En 才学 宙 顺 chapoa wa 


司 视频 文件 ，\sample\ 上 机 题 \chap02\.…. 
2.1 现 有 我 国 31 个 省 、 市 、 自 治 区 的 GDP 的 统计 数据 ， 数 据 中 包括 “城市 ”“GDP” 
和 “人 口 ”3 个 变量 ， 如 下 表 所 示 (数据 路 径 : 视频 文件 \sample\ 上 机 题 \chap02\ 习 题 \ 第 2 章 第 
一 题 .sav) 。 
城市 GDP ( 亿 ) 人 HF) 城市 GDP ( 亿 ) 人 口 (万 ) 

上 海 5400 1674 山西 2000 3297 

北京 3130 1382 黑龙 江 2200 3689 

天 津 1900 1001 330 562 

浙江 7400 4677 安徽 3500 5986 

江苏 10000 7438 重庆 1800 3090 

广东 11000 8642 青海 300 518 

福建 4100 3471 4800 8329 

山东 10500 9079 西藏 150 262 

过 字 4600 4238 陕西 2000 3605 

新 疆 1600 1925 2300 4288 

湖北 5000 6028 2200 4140 

河北 5500 6744 广西 2200 4489 

吉 2100 2728 甘肃 1100 2562 

海南 600 787 950 2376 

湖南 4200 6440 1100 3525 

河南 6000 9256 


试 计算 出 人 均 GDP (人均 GDP=GDP/ 和 人口) 作为 新 变量 保存 。 


2.2 


测量 ， 我 们 建立 了 3 个 变量 : 


为 了 测量 儿童 身体 发 育 状况 ， 随 机 抽查 了 30 名 儿童 ， 对 他 们 的 肺活量 和 体重 进行 了 
“测试 编号 ” “肺活量 ”和 “体重 ”， 部 分 观测 数据 如 下 表 所 示 。 
(数据 路 径 : 视频 文件 \sample\ 上 机 题 \chap02\ 习 题 \ 第 2 章 第 二 题 .sav) 


肺活量 mL) 


体重 (kg) 


olvs|w |- 
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( 续 表 ) 


测试 编号 肺活量 mL) 体重 (kg) 


(1) 根据 理论 ， 儿 童 的 肺活量 与 体重 呈正 比 ， 为 正确 分 析 儿 童 发 育 状况 ， 试 以 体重 作为 
加 权 变 量 对 数据 进行 加 权 。 

(2) 对 于 体重 而 言 ，20kg 以 上 视 为 超重 、18~20kg 视 为 发 育 良好 ，18kg 以 下 视 为 发 育 情 
况 一 般 。 试 对 各 种 超重 人 数 进行 统计 ， 并 保存 计数 结果 。 

(3) 试 将 体重 数据 换算 为 超重 、 发 育 良好 和 与 发 育 情况 一 般 3 类 ， 分 别 用 数字 1、2、3 
代替 (20kg 以 上 视 为 超重 、18~20kg 视 为 发 育 良好 ，18kg 以 下 视 为 发 育 情况 一 般 ) 。 

(4) 请 输出 儿童 体重 的 排名 信息 ， 如 果 体 重 相同 则 并 列 名 次 。 


2.3 某 小 学 对 学 生 进行 体检 ， 测 量 了 90 名 小 学 生 的 身高 ， 根 据 查 体 结果 建立 了 “年 级 ” 
“性 别 ” 和 “身高 ”3 个 变量 ， 部 分 测量 数据 如 下 表 所 示 “〈 数 据 路 径 : 视频 文件 \sample\ 上 机 
题 \chap02\ 习 题 \ 第 2 章 第 三 题 .sav) 。 


年 级 性 别 身高 (cm) 
123.5 

115.8 

115 

107 

125.3 

118.2 

115.2 

119 


(1) 试 按 性 别 分 别 输出 身高 均值 ， 分 析 不 同性 别 的 学 生 的 身高 情况 。 
(2) 试 按照 身高 的 高 低 对 学 生 数据 进行 排序 。 


2.4 研究 者 观察 了 某 地 1978 年 ~2004 年 人 口 数量 的 数据 。 建 立 了 “年 份 ” 和“ 人口 ”两 
个 变量 ， 观 测 数 据 如 下 表 所 示 (数据 路 径 :， 视频 文件 \sample\ 上 机 题 \chap02\ 习 题 \ 第 2 章 第 四 
题 .sav) 。 


人 口 (万 ) 人 口 (万 ) 
1978 1098.28 1992 1289.37 
1979 | 1132.14 1993 1294.74 
1980 | 1146.52 1994 
1981 | 1162.84 1995 1301.37 
| 1180.51 1304.43 
1194.01 1305.46 
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( 续 表 ) 


年 份 人 口 (万 ) 年 份 人 口 (万 ) 

1984 1204.78 1998 1306.58 
1985 | 1216.69 1999 1313.12 
1986 | 1232.33 2000 1321.63 
1987 | 1249.51 2001 1327.14 
1988 | 1262.42 2002 1334.23 
1989 | 1276.45 2003 1341.77 

| 1283.35 2004 1352,39 


因 


为 某 些 原因 ，1994 年 的 数据 缺失 ， 我 们 需要 对 缺失 值 进行 合理 蔡 代 以 便 进 行 相应 的 分 
析 ， 试 采用 序列 均值 的 方式 进行 缺失 值 的 蔡 代 操作 。 


2.5 ”调查 者 观测 了 3 种 不 同 工 艺 下 某 种 产品 的 产量 〈 单 位 : 件 / 小 时 ) ， 数 据 采 用 了 横向 
格式 保存 〈 数 据 路 径 : 视频 文件 \sample\ 上 机 题 \chap02\ 习 题 \ 第 2 章 第 五 题 -sav) 。 


观测 组 Ei 下 艺人 3 


45 
78 


84 


由 于 分 析 的 需要 ， 我 们 希望 得 到 纵向 格式 的 数据 ， 试 将 数据 转换 为 纵向 格式 。 


2.6 调查 者 观测 了 4 种 不 同 水 源 下 3 种 元 素 的 产量 ， 数 据 采 用 了 纵向 格式 保存 (数据 路 
径 : 视频 文件 vsample\ 上 机 题 \chap02\ 习 题 \ 第 2 章 第 六 题 .sav) 。 


观测 组 元 素 含量 (%) 


心 | 上 | 上 mwlwlwlblbleilm-i| -| =- 


现 希 望 得 到 横向 格式 的 数据 ， 试 将 其 转换 为 横向 格式 。 
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2.7 调查 者 观测 了 来 自 不 同 地 区 的 样本 的 经 济 指标 和 发 展 指标 的 数据 ， 这 两 个 地 区 分 别 
用 数字 “1” 和 “2” 代 蔡 , 部 分 观测 数据 如 下 表 所 示 (数据 路 径 : 视频 文件 \sample\ 上 机 题 \chap02\ 
习题 \ 第 2 章 第 七 题 .sav) 。 


地 区 经 济 指标 %) 发 展 指标 〈%) 
和 3 15.9 
115.8 15 
115 15 
107 3 


125.3 19 


118.2 了 


一 | 一 |=- -| 


115.2 


我 们 希望 按照 地 区 分 析 这 两 个 指标 , 以 便 对 地 区 的 综合 竞争 力 给 以 科学 的 评价 , 请 对 数据 
按 地 区 分 解 并 组 织 输出 。 


2.8 请 通过 下 面 3 个 小 题 , 体会 将 其 他 数据 文件 导入 SPSS 的 方法 (数据 路 径 : 视频 文件 


16.2 


\sample\ 上 机 题 \chap02\ 习 题 \ 第 2 章 第 八 题 ) 。 
(1) 试 将 Excel 数据 文件 “第 2 章 第 八 题 (1) .xls” 读 入 SPSS。 


四 帮助 0) A 


(2) 试 将 文本 文件 “第 2 章 第 八 题 (2) .txt” 读 入 SPSS。 
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学 号 性 别 年龄 ”身高 体重 肺活量 
38138 女 7 123.5 15.9 866 
38887 女 115.8 15 1188 
38888 7 115 15 1988 
39857 7 187 13.1 988 
O041 女 7 125.3 19 788 
与 B11 征 诊 女 7 118.2 17 680 
38677 丁 维 思 女 7 115.2 16.2 988 
40010 何 落 EE 119 17.3 799 
38864 ” 张 : 7 hi 788 
5488916 何 7 119 17.5 552 
38125 ” 刘 本 118 15 798 
40187 和 女 184.5 13.6 528 
540040 入 入 女 7 Me 798 


(3) 试 将 文本 文件 “第 2 章 第 八 题 (3) .txt” 读 入 SPSS。 


外 第 二 章 第 八 题 (3) 


记事 本 


文件 E) 编辑 下 ) 格式 0) 查看 帮助 0D 

Ea 年 学 号 ”姓名 ”性 别 出 生日 期 身高 ”体重 肺活量 
主 镇 2 369139 席 ， 娟 女 1999-3-31 123.5 15.9 869 

山 2 39987 陈 , 女 1999-5-9 115.8 15 1188 

山洞 小 学 2 39888 杜 开 1999-12-31 115 15 1 

山 入 小 学 2 39857 卓 航 男 1999-7-17 187 13.1 9 

普 家 镇 小 学 1 498n1 女 1999-1-3 125.3 19 

土 主 镇 小 学 1 88114 女 1999-19-17 118.2 17 698 

由 R 2 38977 丁 维 电 女 1999-11-3 115.2 16.2 968 

加 小 学 1 39619 人 女 1999-12-18 119 17.3 798 

小 学 1 38864 1999-4-21 117.4 17 799 

小 学 1 848816 女 1999-12-8 119 17.5 552 

凤凰 镇 1 39125 1999-9-13 1198 15 788 

士 主 镇 4 1 48187 申 红 佳 女 1999-7-9 184.5 13.6 528 

这 过 省 1 40040 女 1999-6-26 116.7 17 788 

土 主 镇 小 学 2 39638 李 思 洁 女 1999-8-19 117 17.1 999 

西 永 镇 小 学 1 39692 陈真 男 1999-7-12 119.7 18 758 
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在 进行 统计 分 析 和 建 模 之 前 ， 一 般 要 对 数据 做 一 些 描述 性 的 工作 。 通 过 调用 SPSS 的 相关 
过 程 ， 可 以 得 到 数据 的 基本 统计 指标 。 例 如 ， 对 于 定量 数据 ， 可 以 得 到 均值 和 标准 差 等 指标 ; 
对 于 分 类 数据 ， 可 以 得 到 频数 和 比率 等 指标 , 还 可 以 进行 卡 方 检验 等 。 本 章 将 结合 大 量 实例 和 
图 形 ， 详 细 介绍 这 些 过 程 的 具体 操作 并 对 结果 进行 解释 。 


3.1 描述 性 分 析 


描述 性 分 析 过 程 主要 用 于 对 连续 变量 做 描述 性 分 析 , 可 以 输出 多 种 类 型 的 统计 量 , 也 可 以 
将 原始 数据 转换 成 标准 Z 分 值 并 存 入 当前 数据 集 。 本 节 将 结合 实例 对 几 个 常用 基本 统计 量 的 
描述 性 分 析 过 程 进行 详细 介绍 。 


3.1.1 基本 统计 量 的 计算 与 描述 性 分 析 简 介 


描述 性 分 析 主 要 是 对 数据 进行 基础 性 描述 ， 主 要 用 于 描述 变量 的 基本 特征 。SPSS 中 的 描 
述 性 分 析 过 程 可 以 生成 相关 的 描述 性 统计 量 ， 如 均值 、 方 差 、 标 准 差 、 全 距 、 峰 度 和 偏 度 等 ， 
同时 描述 性 分 析 过 程 还 将 原始 数据 转换 为 Z 分 值 并 作为 变量 存储 ， 通 过 这 些 描 述 性 统计 量 ， 
我 们 可 以 对 变量 变化 的 综合 特征 进行 全 面 的 了 解 。 
1. 表示 集中 趋势 的 统计 量 
(1) 均值 
均值 分 析 可 以 分 为 算数 平均 数 、 调 和 平均 数 及 几何 平均 数 3 种 。 
@ 算数 平均 数 。 算 数 平均 数 是 集中 趋势 中 常用 且 重 要 的 测度 值 。 它 是 将 总 体 标志 总 量 除 
以 总 体 单位 总 量 而 得 到 的 均值 。 算 数 平均 数 的 基本 公式 是 
算数 平均 数 -总 体 标志 总 量 /总 体 单位 总 量 
根据 所 掌握 资料 的 表现 形式 不 同 ， 算 数 平均 数 有 简单 算数 平均 数 和 加 权 算 数 平均 数 两 种 。 
。 简单 算数 平均 数 是 将 总 体 各 单位 每 一 个 标志 值 加 总 得 到 的 标志 总 量 除 以 单位 总 量 而 求 出 
的 平均 指标 。 其 计算 方法 如 公式 (3-1 ) 所 示 : 
tt _27 (3-1) 
n n 


简单 算数 平均 数 适用 于 总 体 单位 数 较 少 的 未 分 组 资料 。 如 果 所 给 的 资料 是 已 经 分 组 
的 次 数 分 布 数列 ， 则 算数 平均 数 的 计算 应 采用 加 权 算 数 平均 数 的 形式 。 

。。 加 权 算数 平均 数 是 首先 用 各 组 的 标志 值 乘 以 相应 的 各 组 单位 数 求 出 各 组 标志 总 量 ， 并 加 总 求 
得 总 体 标志 总 量 ， 然 后 将 总 体 标志 总 量 和 总 体 单位 总 量 对 比 。 其 计算 过 程 如 公式 (3-2 ) 所 示 : 
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TA ttfX, 2 C3 
而 二 六 4 办 pe 


其 中 了 表示 各 组 的 单位 数 ， 或 者 说 是 频数 和 权 数 。 

@ 调和 平均 数 。 调 和 平均 数 又 称 倒数 平均 数 , 它 是 根据 各 变量 值 的 倒数 来 计算 的 平均 数 。 
具体 地 讲 , 调和 平均 数 是 各 变量 值 倒数 的 算数 平均 数 的 倒数 。 调 和 平均 数 的 计算 方法 , 根据 所 
掌握 的 资料 不 同 ， 也 有 简单 和 加 权 两 种 形式 。 

@ 几何 平均 数 。 几 何平 均 数 是 与 算数 平均 数 和 调和 平均 数 不 同 的 另 一 种 平均 指标 ， 它 是 
几何 级 数 的 平均 数 。 几 何平 均 数 是 计算 平均 比率 或 平均 发 展 速度 常用 的 统计 量 , 几何 平均 数 可 
以 反映 现象 总 体 的 一 般 水 平 。 根 据 所 掌握 资料 的 不 同 ， 几 何平 均 数 也 有 简单 和 加 权 两 种 形式 。 


(2) 中 位 数 

中 位 数 是 将 总 体 单位 某 一 变量 的 各 个 变量 值 按 大 小 顺序 排列 , 处 在 数列 中 间 位 置 的 那个 变 
量 值 就 是 中 位 数 。 

在 资料 未 分 组 的 情况 下 , 将 各 变量 值 按 大 小 顺序 排列 后 , 首先 确定 中 位 数 的 位 置 ， 可 用 公 
式 叶 确定 ，? 代表 总 体 单位 的 项 数 ， 然 后 根据 中 点 位 置 确定 中 位 数 。 有 两 种 情况 ， 当 ”为 厅 
数 项 时 ， 则 中 位 数 就 是 居于 中 间 位 置 的 那个 变量 值 ， 当 ?为 偶数 项 时 ， 则 中 位 数 是 位 于 中 间 位 
置 的 两 个 变量 值 的 算数 平均 数 。 

(3) 众 数 

众 数 是 总 体 中 出 现 次 数 较 多 的 标志 值 众 数 只 有 在 总 体 单位 较 多 而 又 有 明确 的 集中 趋势 的 
资料 中 才 有 意义 。 单 项 数列 中 ,出 现 最 多 的 那个 组 的 标志 值 就 是 众 数 。 若 在 数列 中 有 两 组 的 次 
数 是 相同 的 ， 且 次 数 最 多 ， 则 就 是 双 众 数 或 复 众 数 。 

(4) 百 分 位 数 

如 果 将 一 组 数据 排序 ,并 计算 相应 的 累计 百 分 位 , 则 某 一 百 分 位 所 对 应 数据 的 值 就 称 为 这 
一 百 分 位 的 百 分 位 数 。 常 用 的 有 四 分 位 数 ， 指 的 是 将 数据 分 为 四 等 份 ， 分 别 位 于 25%、50% 和 
75% 处 的 分 位 数 。 百 分 位 数 适合 于 定 序数 据 及 更 高 级 的 数据 ,不 能 用 于 定 类 数据 。 百 分 位 数 的 
优点 是 不 受 极端 值 的 影响 。 


2. 表示 离 中 趋势 的 统计 量 


(1 ) 方差 与 标准 差 

方差 是 总 体 各 单位 变量 值 与 其 算数 平均 数 的 离 差 平方 的 算数 平均 数 ， 用 o? 表示， 方差 的 
平方 根 就 是 标准 差 o 。 与 方差 不 同 的 是 ， 标 准 差 是 具有 量 纲 的 ， 它 与 变量 值 的 计量 单位 相同 ， 
其 实际 意义 要 比方 差 清楚 。 因 此 ， 在 对 社会 经 济 现象 进行 分 析 时 ， 往 往 更 多 地 使 用 标准 差 。 

根据 所 掌握 的 资料 不 同 ， 方 差 和 标准 差 的 计算 有 两 种 形式 : 简单 平均 式 和 加 权 平 均 式 。 


。 在 资料 未 分 组 的 情况 下 ， 采 用 简单 平均 式 ， 如 公式 (3-3 ) 所 示 : 


2 2 
ED) a >-X) a 
n n 


。 在 资料 分 组 的 情况 下 ， 采 用 加 权 平均 式 ， 如 公式 (3-4) 所 示 : 


gs 
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~ Pe 一 一 (3.4) 


(2 ) 均值 标准 误差 

均值 标准 误差 就 是 样本 均值 的 标准 差 ， 是 描述 样本 均值 和 总 体 均 值 平均 偏差 程度 的 统计 量 。 

(3 ) 极 差 或 范围 

极 差 又 称 全 距 ， 它 是 总 体 单位 中 最 大 变量 值 与 最 小 变量 值 之 差 ， 即 两 极 之 差 ， 以 RR 表示 。 
根据 全 距 的 大 小 来 说 明 变 量 值 变动 范围 的 大 小 。 如 公式 〈3-5) 所 示 : 

弟 三 汪汪 (3-5) 

极 差 只 是 利用 了 一 组 数据 两 端的 信息 , 不 能 反映 出 中 间 数 据 的 分 散 状况 , 因而 不 能 准确 描 
述 出 数据 的 分 散 程度 ， 且 易 受 极端 值 的 影响 。 

(4) 最 大 值 

顾名思义 ， 最 大 值 即 样本 数据 中 取 值 最 大 的 数据 。 

(5) 最 小 值 

样本 数据 中 取 值 最 小 的 数据 。 

(6) 变异 系数 


变异 系数 是 将 标准 差 或 平均 差 与 其 平均 数 对 比 所 得 的 比值 ， 又 称 离散 系数 。 计 算 公式 如 
(3-6) ~ (3-7) 所 示 : 


Oo 
-和 (3-6) 
六 二 二 (3.7) 
玉 


VW 和 万 分别 表示 标准 差 系数 和 平均 差 系 数 。 变 异 系 数 是 一 个 无 名 数 的 数值 ， 可 用 于 比较 
不 同 数列 的 变异 程度 。 其 中 ， 常 用 的 变异 系数 是 标准 差 系 数 。 

3. 表示 分 布 形 态 的 统计 量 

(1) 偏 度 

偏 度 是 对 分 布 偏 斜 方向 及 程度 的 测度 。 测量 偏 斜 的 程度 需要 计算 偏 态 系数 , 本 书 仅 介 绍 中 
心 矩 偏 态 测度 法 。 常 用 三 阶 中 心 矩 除 以 标准 差 的 三 次 方 ， 表 示 数 据 分 布 的 相对 偏 斜 程度 ， 用 
4 表示。 其 计算 公式 如 〈3-8) 所 示 : 
, T/A 
1 ay 
在 公式 〈3-8) 中 ，a; 为 正 ， 表 示 分 布 为 右 偏 : as 为 负 ， 则 表示 分 布 为 左 偏 。 
(2) 峰 度 


峰 度 是 频数 分 布 曲线 与 正 态 分 布 相 比 较 , 顶端 的 尖 峭 程度 。 统计 上 常用 四 阶 中 心 矩 测定 峰 
度 ， 其 计算 公式 如 〈3-9) 所 示 : 


(3-8) 
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_ S/H 
es 
o 让 
当 a4=3 时 ， 分 布 曲线 为 正太 分布; 
当 a4 <3 时 ， 分 布 曲线 为 平 峰 分 布 ; 
当 a4 >3 时 ， 分 布 曲线 为 尖峰 分 布 。 
4. 其 他 相关 的 统计 量 
乙 标 准 化 得 分 
Z 标准 化 得 分 是 某 一 数据 与 平均 数 的 距离 以 标准 差 为 单位 的 测量 值 。 其 计算 公式 如 (3-10) 


(3-9) 


pA 
Oo 


rE 


i 


(3-10) 


在 公式 (3-10) 中 ，Z; 即 为 X; 的 乙 标准 化 得 分 。Z 标准 化 数据 越 大 ， 说 明 它 离 平均 数 越 远 。 

标准 化 值 不 仅 能 表明 各 原始 数据 在 一 组 数据 分 布 中 的 相对 位 置 ,而 且 能 在 不 同 分 布 的 各 组 
原始 数据 间 进行 比较 ,同时 还 能 接受 代数 方法 的 处 理 。 因此 ,标准 化 值 在 统计 分 析 中 起 着 十 分 
重要 的 作用 。 


3.1.2 ”描述 性 分 析 的 SPSS 操作 


首先 打开 相应 的 数据 文件 ， 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 
器 窗口 中 进行 描述 性 统计 分 析 。 


1) 在 SPSS Statistics 数据 编辑 器 窗口 的 菜单 栏 中 选择 “分 析 ”|“ 描 述 统计 ”| “描述 ” 命 
令 ， 打 开 如 图 3-1 所 示 的 “描述 ”对 话 框 。 

2) 选择 变量 。 

先 从 源 变 量 列表 框 中 选择 需要 描述 的 变量 ， 然 后 单 击 因 按钮 将 需要 描述 的 变量 先入“ 变 
量 ” 列 表 框 中 ， 如 图 3-2 所 示 。 


加 持 标 交 化 值 另存 为 交 量 (Z) 


[LE ] ae aa EY 
图 3-1 “描述 ”对 话 框 图 3-2 先入 要 描述 的 变量 
3) 进行 选项 设置 。 
单 击 右 侧 的 “选项 ”按钮 ， 弹 出 如 图 3-3 所 示 的 “描述 : 选项 ”对 话 框 。 
“描述 : 选项 ”对 话 框 用 于 指定 需要 输出 和 计算 的 基本 统计 量 和 结果 输出 的 显示 顺序 ,分 
为 4 个 部 分 。 
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@ “平均 值 * 和 “总 和 ” 复 选 框 。 选 中 “平均 值 ” 复 选 框 ， 

表示 输出 变量 的 算术 平均 数 ， 选 中 “总 和 ” 复 选 杠 ， 表 示 输 出 各 “| 一: 

个 变量 的 合计 数 。 加 So。 日 Sn 
@ “离散 ”选项 组 。 该 选项 组 用 于 输出 离 中 趋势 统计 量 ，。 | [eg D00 

共有 6 个 复 选 框 : “标准 差 ”“ 方 差 ”“ 最 小 值 ”“ 最 大 值 "“ 范 | | Baaw 

围 ”“ 标 准 误差 平均 值 ”， 选 中 这 些 复 选 框 分 别 表示 输出 变量 的 0 

标准 差 、 方 差 、 最 小 值 、 最 大 值 、 范 围 、 平 均值 的 标准 误 。 | 
@@ “分 布 ”选项 组 。 该 选项 组 用 于 输出 表示 分 布 的 统计 量 : ms 


。 “ 峰 度 " 复 选 框 , 选中 该 复 选 框 , 表示 输出 变量 的 峰 度 统计 量 。 | 加 


O88 


。 “ 偏 度 ” 复 选 框 , 选中 该 复 选 框 , 表示 输出 变量 的 偏 度 统计 量 。 人 技 平 均值 的 升序 排序 (C) 


卜 二 述 : 选项 这 


@ “显示 顺序 ”选项 组 。 该 选项 组 用 于 设置 变量 的 排列 顺 | 

“显示 顺序 ”选项 组 。 该 ; 设置 变 列 | ER 

序 。 有 以 下 4 种 选择 : EOETIETY 
变量 列表 : 表示 按 变 量 列表 中 变量 的 顺序 进行 排序 。 图 3-3 “描述 ， 选 项 ”对 话 框 


字母 : 表示 按 变 量 列 表 中 变量 的 首 字母 的 顺序 排序 。 
按 平 均值 的 升序 排序 : 表示 按 变 量 列表 中 变量 的 均值 的 升序 排序 。 
按 平均 值 的 降序 排序 : 表示 按 变 量 列表 中 变量 的 均值 的 降序 排序 。 

其 中 ， 系 统 默认 的 基本 统计 量 是 “平均 值 ” “标准 差 ”“ 最 大 值 ”“ 最 小 值 ”和 “显示 顺 
序 ” 选 项 组 中 的 “变量 列表 ”。 

设置 完毕 后 ， 单 击 “ 继 续 ” 按 钮 ， 返 回 到 “描述 ”对 话 框 。 

4) 设置 “将 标准 化 值 另存 为 变量 ” 复 选 框 。 

如 果 选 中 该 复 选 框 ， 则 表示 为 变量 列表 中 的 每 一 个 要 分 析 描 述 的 变量 都 要 计算 Z 标准 化 
得 分 ， 并 且 系 统 会 将 每 个 变量 的 Z 标准 化 得 分 保存 到 数据 文件 中 其中， 新 变量 的 命名 方式 
是 在 源 变量 的 变量 名 前 加 Z， 如 源 变量 名 为 “Math”， 则 生成 的 新 变量 名 为 “ZMath”) 。 

5) 分 析 结 果 输 出 。 

单 击 “ 确 定 ”按钮 ， 就 可 以 在 SPSS Statistics 查看 器 窗口 中 得 到 所 选择 的 变量 描述 性 分 析 
的 结果 。 

单 击 “ 重 置 ”按钮 ， 即 可 以 重新 选择 变量 ， 重 新 设置 “选项 ”。 


3.1.3 ”实验 操作 


下 面 将 以 “3-1” 数 据 文件 为 例 ， 说 明 描述 性 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 解 释 。 
1. 实验 数据 的 描述 


“3-1” 数 据 文件 记录 了 两 个 班级 学 生 的 数学 成 绩 、 语 文成 绩 信 息 ， 以 此 数据 文件 为 例 ， 
利用 描述 性 分 析 该 数据 文件 中 的 一 些 基本 统计 量 。Excel 原始 数据 文件 如 图 3-4 所 示 。 

首先 在 SPSS 变量 视图 中 建立 变量 “ID”“Math” 和 “CHINESE”， 分 别 表 示 班 级 、 数 
学 成 绩 和 语文 成 绩 ，3 个 变量 的 度量 标准 均 为 “度量 ”， 如 图 3-5 所 示 。 
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EP - oO x 


4 
1 
2 1 罗 2 
3 2 57 07 LL 
4 3 2 2 
5 4 四 区 
6 5 64 62 
7 5 上 到 
下 了 of nn 
9 8 69 57 
0 9 7 nr 
六 10 73 78 
全 1 73 0 
全 12 稳 允 
14 13 76 18 
1 14 加 加 
1 15 76 ot 
条 玖 施 析 才气 | 图 ”< 
部 请 二 四 -一 一 一 二 一 + 100% SPS5 Siahsbcs 外 二 得 友 必 站 | | [UnicodecN | 
图 3-4 “3-1” 原 始 数据 文件 3-5 “3-1” 数 据 文件 的 变量 视图 


然后 在 SPSS 数据 视图 中 把 相关 数据 输入 到 各 个 变量 中 。 其 中 ，“ID” 变 量 中 “1” 表 示 
“一 班 ”“2” 表 示 “ 二 班 ”。 输 入 完毕 后 部 分 数据 如 图 3-6 所 示 。 


起 "Tv (1] - IBM SPSS Statistics 类 天 加 当 = 
文件 加 编 可 全 ) 查看 (数据 但 ) 转换 CD) 分析) 商 消 EECG) 实用 程序 LW) 扩 隘 Q) 亩 口 GD。 大助 () 


ELT TE EN 


时 


BW SPSS Slatsics 处 理 程 让 结 | | [Unicode ON 


3-6 输入 完毕 后 部 分 数据 


2. 实验 操作 步骤 


人 GE) 打开 “3-1” 数 据 文 件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 然 后 在 菜单 栏 中 选择 
“分 析 ”| “描述 统计 ”| “描述 ”命令 ,打开 “描述 ”对 话 框 , 将 “数学 (Math)”“ 语 
文 (CHINESE) ”先入 “变量 ”列表 框 中 。 

人 GE562? 单 击 “ 选 项 ”按钮 ， 弹 出 “描述 : 选项 ”对 话 框 ， 选 中 “最 大 值 ”“ 最 小 值 ”“ 平 均 
值 ”“ 标 准 差 ”“ 峰 度 ” 和 “ 偏 度 ” 复 选 框 ， 在 “显示 顺序 ”选项 组 中 选中 “变量 列 
表 ” 单 选 按钮 ， 显 示 结 果 将 按照 数学 、 语 文 的 顺序 排列 ， 然 后 单 击 “ 继 续 ” 按 钮 ， 
返回 “描述 ”对 话 框 。 

人 GE563 选中 “将 标准 化 值 另 存 为 变量 (Z)” 复 选 框 ， 最 后 单 击 “ 确 定 ” 按 钮 。 
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3. 实验 结果 及 分 析 


选 定 需要 进行 描述 分 析 的 变量 和 设置 所 需要 得 到 的 统计 量 之 后 , 单 击 “ 确 定 ” 按 钮 就 可 以 
得 到 描述 性 分 析 的 结果 ， 如 图 3-7 和 图 3-8 所 示 。 


描述 统计 
个 案 数 最 小 值 最 大 值 平均 值 标准 差 偏 度 锋 厦 
统计 统计 统计 统计 统计 统计 标准 误差 统计 标准 误差 
数学 80 46 99 78.71 10.617 -.539 269 .228 .532 
语 :3 | 80 47 | 99 | 79.83 10.833 je 726 | .269 .405 | 532 


有 效 个 案 数 【成 列 》 80 


3-7 描述 统计 量 

图 3-7 给 出 了 描述 性 分 析 的 主要 结果 。 从 该 图 可 以 得 到 各 个 变量 的 个 数 、 最 大 值 、 最 小 值 
等 统计 量 。 以 “数学 ”成 绩 为 例 ， 从 描述 性 分 析 的 结果 可 以 看 出 : 数学 成 绩 的 最 低 分 是 46 分 ， 
最 高 分 是 99 分 , 平均 分 为 78.71， 表 示 成 绩 波动 程度 的 标准 差 为 10.617, 样本 成 绩 的 偏 度 小 于 
零 ， 峰 度 小 于 正 态 分 布 的 峰 度 3， 可 见 成 绩 的 分 布 右 偏 ， 不 服从 正 态 分 布 。 

从 图 3-8 可 以 看 出 ， 在 选中 “将 标准 化 值 另存 为 变量 (Z) ” 复 选 框 后 ， 数 据 文 件 中 就 会 
增加 两 个 新 的 变量 “ZMath” 和 “ZCHINESE”， 分 别 表 示 “ 数 学 ”“ 语 文 ” 的 乙 标准 化 值 。 
以 “ZMath” 为 例 ， 通 过 该 统计 量 可 以 看 出 ， 大 于 零 的 数值 表示 该 学 生 的 数学 成 绩 比 平均 分 要 
高 ， 小 于 零 的 数值 表示 该 学 生 的 数学 成 绩 要 比 平均 分 低 ， 如 第 1 个 数值 为 -3.08124， 即 该 学 生 
比 整个 平均 分 要 低 3 个 标准 差 。 


| 起 “分 伯 咎 型 sov | 站 吏 委 1] -IBM SPSS Slatistics 类 要 抽 加 - D x 
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图 3-8 “3-1” 数 据 文件 的 数据 视图 


3.2 ”频数 分 析 


频数 分 析 是 描述 性 统计 中 最 常用 的 方法 之 一 。SPSS 的 频数 分 析 过 程 不 但 可 以 分 析 变 量变 
化 的 基本 趋势 ， 还 可 以 生成 相应 的 统计 图 表 。 
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3.2.1 “频数 分 析 简 介 


频数 ， 也 称 频率 ,表示 一 个 变量 在 不 同 取 值 下 的 个 案 数 。 频 数 分 析 可 以 对 数据 的 分 布 趋势 
进行 初步 分 析 ， 为 深入 分 析 打 下 基础 。SPSS 中 的 频数 分 析 过 程 可 以 方便 地 产生 详细 的 频数 分 
布 表 ， 使 数据 分 析 者 可 以 对 数据 特征 与 数据 的 分 布 有 一 个 直观 的 认识 。 此 外 ，SPSS 的 频数 分 
析 过 程 还 可 以 给 出 相应 百分点 的 数值 ,因而 其 在 分 类 变量 和 不 服从 正 态 分 布 变量 的 描述 中 具有 
广泛 的 应 用 。 


3.2.2 ”频数 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 即 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 频数 分 析 ， 过 程 如 下 : 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 描 述 统计 ”|“ 频 率 ” 命 令 ， 打 开 如 图 3-9 所 示 的 “频率 ” 


2) 选择 变量 。 
在 源 变量 列表 框 中 选择 一 个 或 多 个 变量 , 单 击 国 按 钮 使 其 选 入 “变量 ”列表 框 中 作为 频数 
分 析 的 变量 。 
3) 进行 相应 的 设置 。 
“统计 ”设置 
单 击 “ 统 计 ” 按 钮 ， 打 开 如 图 3-10 所 示 的 “频率 : 统计 ”对 话 框 。 
Le E> x 
百 分 位 信 集中 直 激 
加 四 位 数 @) | 品 平 均值 QI) 
司 分 点 QD): 。 10 相关 组 | 回 中 位 者 (D) 
加 百 分 位 下 (2): 昕 办 数 @) 
区 四 口 SG) 
二 
个 值 为 组 的 中 点 (L) 
南 艇 分 
本 标准 差 中 加 最 小 值 0 司令 WD 
口 方差 加 最 大 值 @) 口内 (9) 
| 范围 N) 问 标准 洪 差 均值 (E) 
[EE EE 
图 3-9 “频率 ”对 话 框 图 3-10 “频率 : 统计 ”对 话 框 


该 对 话 框 用 于 设置 需要 在 输出 结果 中 出 现 的 统计 量 ， 主 要 包括 4 个 选项 组 。 
Q 百 分 位 值 。 该 选项 组 主要 用 于 设置 输出 的 百 分 位 数 ， 包 括 以 下 3 个 复 选 框 : 


。 “四 分 位 数 ” 复 选 框 ， 用 于 输出 四 分 位 数 。 
。 “分 割 点 ” 复 选 框 ， 用 于 输出 等 间隔 的 百 分 位 数 ， 在 其 后 的 文本 框 中 可 以 输入 介 于 2~100 
的 整数 。 
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。 “ 百 分 位 数 ” 复 选 框 ， 用 于 输出 用 户 自 定义 的 百 分 位 数 。 在 其 后 的 文本 框 中 输入 自 定义 的 
百 分 位 数 ， 然 后 单 击 “ 添 加 ”按钮 加 入 相应 列表 框 即 可 在 结果 中 输出 。 对 于 已 经 加 入 列表 
框 的 百 分 位 数 ， 用 户 还 可 以 通过 “更 改 ” 和 “除去 ”按钮 进行 修改 和 删除 操作 。 

@ 集中 趋势 。 该 选项 组 用 于 设置 输出 表示 数据 集中 趋势 的 统计 量 ， 包 括 “ 平 均值 ”“ 中 
位 数 ”“ 众 数 ” 和 ”总 和 ”4 个 复 选 框 ， 分 别 用 于 输出 的 均值 、 中 位 数 、 众 数 和 样本 数 。 

@ 离散 。 该 选项 组 用 于 设置 输出 表示 数据 离 中 趋势 的 统计 量 ， 包 括 “ 标 准 差 ”“ 方 差 ” 
“最 小 值 ”“ 最 大 值 ” “范围 ”和 “标准 误差 平均 值 ”6 个 复 选 框 ,用 于 输出 的 标准 差 、 方 差 、 
最 小 值 、 最 大 值 、 全 距 和 均值 的 标准 误差 。 

图 分 布 。 该 选项 组 用 于 设置 输出 表示 数据 分 布 的 统计 量 ， 包 括 “ 偏 度 ” 和 “ 峰 度 ” 两 个 
复 选 框 ， 用 于 输出 样本 的 偏 度 和 峰 度 。 

@@ “ 值 为 组 的 中 点 ” 复 选 框 。 当 原始 数据 采用 的 是 取 组 中 值 的 分 组 数据 时 (如 所 有 收入 
在 1000~2000 元 人 的 收入 都 记录 为 1500 元 ) ， 选 中 该 复 选 框 。 

“图 表 ” 设 置 

单 击 “ 图 表 ” 按 钮 ， 打 开 如 图 3-11 所 示 的 “频率 : 图 表 ” 对 话 框 。 

该 对 话 框 用 于 设置 输出 的 图 表 ， 主 要 包括 两 个 选项 组 。 

@ 图 表 类 型 。 该 选项 组 用 于 设置 输出 的 图 表 类 型 ， 有 4 种 选择 : “无 ”表示 不 输出 任何 
图 表 ; “条 形 图 ”表示 输出 条 形 图 ; “ 饼 图 ”表示 输出 饼 状 图 ; “直方 图 ” 表示 输出 直方 图 ( 仅 
适用 于 数值 型 变量 ) ， 若 选中 “在 直方 图 上 显示 正 态 曲线 ” 复 选 框 ， 则 表示 在 输出 图 形 中 包含 
正 态 曲 线 。 

@ 图 表 值 。 该 选项 组 仅 对 条 形 图 和 饼 图 有 效 ， 包 括 频率 和 百分比 两 个 选项 。 

“格式 ”设置 

单 击 “ 格 式 ” 按 钮 打开“ 频率 格式 ”对 话 框 ， 如 图 3-12 所 示 。 


x 


多 个 变量 
加 比较 变量 (C) 
四 按 变 量 组 织 输出 (O) 


图 在 直方 图 中 显示 正 态 曲 稣 人 


图 夫 值 一 口 搬 $$ 有 具有 多 个 类 别 的 表 四 


侠 频 车 (E) 加 百分比 人 最 大 类 别 lvb): |10 
[sj La 开 | 

图 3-11 “频率 : 图 表 ” 对 话 框 图 3-12 “频率 : 格式 ”对 话 框 
该 对 话 框 用 于 设置 输出 格式 ， 主 要 包括 两 个 选项 组 。 


Q 排序 方式 。 该 选项 组 用 于 设置 输出 表格 内 容 的 排序 方式 , 包括 “ 按 值 的 升序 排序 ”“ 按 
值 的 降序 排序 ”“ 按 计数 的 升序 排序 ”和 “ 按 计 数 的 降序 排序 ”4 个 选择 ， 分 别 表 示 按 变量 值 
和 频数 的 升序 或 降序 排列 。 
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@ 多 个 变量 。 该 选项 组 用 于 设置 变量 的 输出 方式 ， 包 括 两 个 选项 : “比较 变量 ”表示 将 
所 有 变量 在 一 个 表格 中 输出 ; “ 按 变量 组 织 输出 ”表示 每 个 变量 单独 列表 输出 。 

@ “排除 具有 多 个 类 别 的 表 ” 复 选 框 。 选 中 该 复 选 框 后 ， 可 以 在 下 面 的 “最 大 类 别 数 ” 
文本 框 中 输入 最 大 能 显示 的 分 组 数量 ， 当 频数 表 的 分 组 数量 大 于 此 临界 值 时 不 做 输出 。 

设置 完毕 后 ， 单 击 “ 继 续 ” 按 钮 ， 返 回 到 “频率 ”对 话 框 。 

4) 分 析 结 果 输 出 。 

单 击 “确定 ”按钮 ， 就 可 以 在 SPSS Statistics 查看 器 窗口 得 到 所 选择 的 变量 频数 分 析 的 
结果 。 


3.2.3 ”实验 操作 


下 面 将 以 数据 文件 “3-2” 为 例 ， 说 明 频 数 分 析 的 具体 操作 过 程 。 
1. 实验 数据 描述 


数据 文件 “3-2” 显 示 了 2008 年 我 国 各 个 地 区 制造 业 的 就 业 人 数 ， 数 据 来 源 于 《中 国 统计 
年 鉴 2008》。 以 该 数据 文件 为 例 ， 利 用 频数 分 析 对 不 同 地 区 的 就 业 情 况 进行 分 析 ， 显 示 四 分 位 
数 、 均 值 和 标准 差 ， 绘 制 频率 分 布 直 方 图 和 正 态 曲 线 ， 并 判断 分 布 形态 。 

本 数据 文件 的 原始 Excel 文件 如 图 3-13 所 示 〈 单 位 : 万) 。 
在 SPSS 的 变量 视图 中 ， 建 立 变量 “地 区 ”和 “制造 业 ”， 如 图 3-14 所 示 。 


本 Sir 加 机 7 IBM SpSS statihticy 天 天 = 日 % 
[7# 虽 人 加 下 而 数据 Q) 转 要 中 分 析 抽 ) 曾 WM) EBHIG) 突 用 程序 扩 民 09) 窗口 QD 大 有 bd) 


ELE 


分 析 


E28 3 名 种 | 中 型 页 展 ， 小 数位 数 | 村 葵 | 值 摧 失 | 到 
无 7 医 左 向 名 义 入 入 入 
dA A B D F | -| 2 无 无 11 再 右 从 本 度 输入 
1 地 区 制造 业 
2 北京 963 
3 天 评 727 
4 | 河北 1164 
5 | 山西 703 
6 | 内 蒙古 39.3 
加 这 宁 147.0 
8 | 吉林 570 Dl 
9 | 黑龙江 844 
10| 上 海 1430 
证 江苏 307.4 
慑 | 浙江 319.2 
人 3 安徽 67.3 
性 | 福 建 2238 
二 | 江西 702 
愉 | 山东 3401 
二 下 分 析 | ”本 5 
Ea EN 0 + 100% BM SPSS Sianshcs wi UneooeON| | | 
» » 
图 3-13 数据 文件 “3-2” 原 始 数据 图 3-14 数据 文件 “3-2” 的 变量 视图 


在 SPSS 活动 数据 文件 中 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 后 部 分 数据 
如 图 3-15 所 示 。 

2. 实验 操作 步骤 

有 具体 的 操作 步骤 如 下 所 示 。 


要 了 TY 打开 “3-2” 数 据 文 件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 然 后 在 菜单 栏 中 选择 
“分 析 ”|“ 描 述 统计 ”| “频率 ”命令 ， 打 开 “ 频 率 ”对 话 框 。 
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起 RBFsav BRE2] -IBM SPSS Statistics ES =  % 
文件 CE) 寺 可 全) 豆 看 GD 数据 @) 转 搞 中 分析 下 清册 HiG) 庆 且 程序 扩展 00 军品 QD 帮 动 ED) 


图 3-15 数据 文件 “3-2” 的 数据 视图 

370> 在 源 变量 列表 框 中 选中 “制造 业 ” 作 为 频数 分 析 的 变量 。 

703 单 击 “ 统 计 ” 按 钮 ， 选 中 “四 分 位 数 ”“ 平 均值 ”“ 标 准 差 ”和 “ 偏 度 ” 复 选 框 ， 单 
击 “ 继 续 ” 按 钮 。 

GE563 单 击 “ 图 表 ” 按 钮 ， 选 中 “直方 图 ” 单 选 按钮 与 “在 直方 图 中 显示 正 态 曲 线 ” 复 选 
框 ， 单 击 “ 继 续 ” 按 钮 。 

GE365 单 击 “确定 ”按钮 ， 执 行 频数 分 析 。 

3. 输出 结果 分 析 


选 定 需要 进行 频数 分 析 的 变量 和 设置 所 需要 得 到 的 统计 量 后 ， 单 击 “ 确 定 ”按钮 就 可 以 得 
到 频数 分 析 的 结果 ， 输 出 结果 如 图 3-16 所 示 。 


直方 图 


制造 业 


110.783 


105.2184 
1.579 | 
421 


39.334 
50 72.708 
75 143.037 


3-16 ”频数 分 析 输出 结果 


统计 量 表 给 出 了 平均 工资 的 均值 、 标 准 差 、 百 分 位 数 等 信息 ， 从 分 析 结 果 可 以 看 出 ,各 地 
区 制造 业 就 业 的 平均 人 数 为 110.783, 标准 差 为 105.2184, 3 个 百 分 位 数 分 别 为 39.334、72.708 
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和 143.037。 表 的 右 侧 为 频率 分 布 直方 图 和 正 态 曲线 。 偏 度 系 数 为 1.579， 由 此 可 以 看 出 , 各 地 
区 的 平均 工资 呈 比 较 明 显 的 偏 态 分 布 。 


3.3 ”探索 分 析 


探索 分 析 可 以 在 对 变量 的 分 布 特点 不 了 解 时 , 对 变量 进行 相关 的 分 析 , 为 用 户 的 下 一 步 数 
据 分 析 提 供 相应 的 参考 。SPSS 提供 了 方便 的 探索 分 析 过 程 ， 下 面 介绍 其 相关 操作 。 


3.3.1 “探索 分 析 简 介 


探索 分 析 主 要 用 于 在 数据 的 分 布 情况 未 知 时 , 检验 数据 的 特异 值 或 输入 错误 , 并 获得 数据 
的 基本 特征 。SPSS 的 探索 分 析 过 程 主要 包括 以 下 3 种 功能 。 


(1) 通过 绘制 箱 图 和 茎 叶 图 等 图 形 , 直观 地 反映 数据 的 分 布 形式 ， 并 识别 输入 的 奇异 值 、 
异常 值 和 丢失 的 数据 。 

(2) 正 态 性 检验 : 检测 观测 数据 是 否 服从 正 态 分 布 。 

(3) 等 方差 性 检验 : 利用 莱 文 检验 检验 不 同 组 数据 的 方差 是 否 相等 。 


3.3.2 ”探索 分 析 的 SPSS 操作 
打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 即 可 在 SPSS Statistics 数据 编辑 器 窗口 中 


进行 探索 分 析 ， 其 过 程 如 下 。 Er 


1) 在 SPSS Statistics 数据 编辑 器 窗口 的 菜单 
栏 中 选择 “分 析 ”|“ 描 述 统计 ”| “探索” 命令 ， 
打开 如 图 3-17 所 示 的 “探索 ”对 话 框 。 

2) 选择 变量 。 

从 源 变 量 列表 框 中 选择 需要 分 析 的 目标 变 
量 ， 然 后 单 击 国 按 钮 将 选中 的 变量 先入 “ 因 变量 


— 
= 


个 案 标 注 依 把 (C): 


汪汪 OitW OED | 


列表 ”列表 框 中 ， 从 源 变 量 列表 中 选择 分 组 变量 ， 

[DD 0 
然后 单 击 因 按钮 选 入 “因子 列表 ”列表 框 中 ， 从 
源 变 量 列表 框 中 选择 标注 变量 ， 单 击 姑 按钮 选 入 图 3-17 “探索 ”对 话 杠 


“个 案 标注 依据 ”列表 框 中 。 


。 “ 因 变 量 列表 ”: 该 列表 框 中 的 变量 为 探索 分 析 过 程 中 需要 分 析 的 目标 变量 ， 变 量 的 属性 
一 般 为 连续 型 变量 或 比率 变量 。 
。 “因子 列表 ”: 该 列表 框 中 的 变量 为 “ 因 变 量 列表 ”中 目标 变量 的 分 组 变量 ， 就 是 对 所 需 
要 分 析 的 目标 变量 进行 分 组 表示 , 该 变量 的 属性 可 以 是 字符 型 或 数值 型 , 但 是 一 般 变 异 较 少 。 
。 “个 案 标注 依据 ”: 一 般 对 输出 异常 值 时 ， 用 该 变量 进行 标识 ， 有 且 只 有 一 个 标识 变量 。 
如 将 图 3-17 中 的 源 变 量 分 别 选 入 “ 因 变 量 列表 ”“ 因 子 列表 ”“ 个 案 标注 依据 ”列表 框 
中 ， 如 图 3-18 所 示 。 
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3) 进行 相应 的 设置 。 
“统计 ”设置 
单 击 右 侧 的 “统计 ”按钮 ， 弹 出 如 图 3-19 所 示 的 “探索 : 统计 ”对 话 框 。 


> 0 


RI 一 
少数 字 [Math] 凶 


因 要 鲁 列 表 (Dj 


DD): 


个 要 主体 据 (G): 


人 曲 统 计 @) 加 图 LU) 
ie J me) EE® aA a | 
图 3-18 选 入 各 个 变量 图 3-19 “探索 : 统计 ”对 话 框 

“探索 : 统计 ”对 话 框 用 于 设置 需要 在 输出 结果 中 出 现 的 统计 量 。 

@“ 描 述 ” 复 选 框 。 选 中 该 复 选 框 ， 表 示 输 出 一 些 描述 性 分 析 中 的 基本 统计 量 ， 如 均值 、 
标准 差 、 范 围 等 ， 该 复 选 框 还 包括 一 个 “平均 值 的 置信 区 间 ” 文 本 框 ， 要 求 设 置 均值 的 置信 区 
间 的 范围 ， 可 以 选择 1%~99% 中 的 任意 一 个 ， 但 系统 默认 的 是 95% 的 置信 区 间 。 

@“M- 估 计量 ” 复 选 框 。 选 中 该 复 选 框 ， 表 示 输 出 4 种 均值 的 稳健 极 大 似 然 估计 量 ， 包 
括 稳 健 估 计量 、 非 降 稳 健 估 计量 、 波 估计 值 、 复 权重 估计 量 ， 一 般 在 样本 数据 非 正 态 分 布 时 ， 
如 金融 时 间 序列 数据 的 尖峰 厚 尾 分 布 ， 用 稳健 极 大 似 然 估 计量 计算 的 均值 更 有 稳健 性 。 
@“ 离 群 值 ” 复 选 框 . 选中 该 复 选 框 , 表示 输出 变量 数据 的 前 5 个 最 大 值 和 后 5 个 最 小 值 。 
@“ 百 分 位 数 ” 复 选 框 。 选 中 该 复 选 框 ， 表 示 输 出 变量 数据 的 百 分 位 数 。 


“图 ”设置 蛤 探 于 : 图 并 
单 击 右 侧 的 “图 ”按钮 ， 弹 出 如 图 3-20 所 示 的 “探索 ， 图 ”| | 氏 一 一 地 
对 话 框 。 GIB) V2) 
日 因 祷 蜂 并 四 @) | | 器 直方 图 I) 
Q@ “ 箱 图 ” 选项 组 。 该 选项 组 用 于 对 箱 图 的 参数 进行 设置 ， | 全 = 
包括 3 个 单 选 按钮 “因子 级 别 并 置 ”表示 多 个 因 变 量 箱 图 将 按 | mom 


照 因 变量 的 个 数 分 别 显示 ; “ 因 变量 并 置 ”， 表 示 多 个 因 变 量 箱 。 | ee 
图 将 不 按照 因 变 量 的 个 数 分 别 显示 , 而 是 一 起 显示 在 一 个 框图 里 。 Ow， 
面 ， “无 ”表示 将 不 显示 因 变 量 的 箱 图 。 口 和 
@ “描述 图 ” 选项 组 。 该 选项 组 用 于 对 统计 图 表 进行 设置 ， EEC 
包括 两 个 复 选 框 : “ 茎 叶 图 ”表示 将 按照 因 变量 输出 相应 的 芭 叶 
图 : “直方 图 ”表示 将 按照 因 变 量 输出 相应 的 直方 图 。 图 3-20 “探索 ， 图 ”对 话 框 
四 “ 含 莱 文 检验 的 分 布 -水 平 图 ”选项 组 。 该 选项 组 用 于 对 数据 转换 的 散布 水 平 图 进行 设 
置 ,可 以 显示 数据 转换 后 的 回归 曲线 斜率 和 进行 方差 齐 性 的 莱 文 检验 ,包括 4 个 单 选 按钮 :无 ” 
表示 将 不 输出 变量 的 散布 水 平 图 ;“ 备 估算 ”表示 对 每 一 个 变量 数据 产生 一 个 中 位 数 的 自然 对 
数 和 四 分 位 数 的 自然 对 数 的 散 点 图 ， 还 可 以 对 各 个 变量 数据 方差 转化 为 同方 差 所 需要 备 的 估 


， 自 好 扫 
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计 ; “转换 后 ”表示 对 因 变 量 数 据 进 行 相应 的 转换 ， 具 体 的 转换 方法 有 自然 对 数 变换 、1/ 平 方 
根 的 变换 、 倒 数 变 换 、 平 方 根 变换 、 平 方 变 换 、 立 方 变 换 ; “未 转换 ”表示 不 对 原始 数据 进行 
任何 变换 。 

图 “ 含 检 验 的 正 态 图 ” 复 选 框 。 选 中 该 复 选 框 ， 可 以 输 
出 变量 数据 的 正 态 概率 图 和 高 散 正 态 概率 图 ， 同 时 输出 变量 数 
据 经 过 Lilliefors 显著 水 平 修正 的 柯 尔 莫 戈 洛 夫 -斯 米 诺 夫 统计 
量 和 夏 皮 洛 - 威 尔 克 统计 量 。 


“选项 ”设置 
单 击 右 侧 的 “选项 ”按钮 ， 弹 出 如 图 3-21 所 示 的 “探索 : 
选项 ”对 话 框 。 图 3-21 “探索 选项 ”对 话 框 


“探索 : 选项 ”对 话 框 用 于 对 缺失 值 进行 设置 设置 方法 有 3 种 : “成 列 排 除 个 案 ” 表 示 
只 要 任何 一 个 变量 含有 缺失 值 ， 就 要 剔除 所 有 因 变 量 或 分 组 变量 中 有 缺失 值 的 观测 记录 ; “成 
对 排除 个 案 ” 表 示 仅 仅 剔 除 所 用 到 的 变量 的 缺失 值 ; “报告 值 ” 表 示 将 变量 中 含有 的 缺失 值 单 
独 作为 一 个 类 别 进 行 统计 并 输出 。 

设置 完毕 后 ， 单 击 “ 继 续 ” 按 钮 ， 返 回 到 “探索 ”对 话 框 。 

4) 分 析 结 果 输 出 。 

单 击 “ 确 定 ” 按 钮 ， 就 可 以 在 SPSS Statistics 查看 器 窗口 得 到 所 选择 的 变量 探索 性 分 析 的 
结果 。 


下 面 将 以 “3-3” 数 据 文件 为 例 ， 说 明 探索 分 析 的 具体 操作 过 程 。 
1. 实验 数据 描述 
“3-3 ”数据 文件 记录 了 两 个 班级 学 生 的 


数学 成 绩 、 语 文成 绩 ， 以 此 数据 文件 为 例 ， i 
利用 探索 分 析 该 数据 文件 中 的 数学 和 语文 | 1。 N97 BM | 
成 绩 的 最 大 值 、 最 小 值 、 众 数 、 平 均 数 等 ， | 1 gs 
并 检验 样本 数据 的 正 态 性 。 原 始 Excel 数据 | 引 本 名 计 
文件 如 图 3-22 所 示 。 国 一 一 一 一 8 一 一 ?4 

在 SPSS 的 变量 视图 中 建立 变量 “id” | ! 各 时 
“Math” “CHINESE” 和 “SEX”， 分 别 表 | 名 1 名 
示 学 生 班 级 、 数 学 成 绩 、 语 文成 绩 和 性 别 ， | 二  1 名 
在 “id” 变 量 中 将 “一 班 ”和 “二 班 ”分 别 。| 加 一 ow 3 一 各 me 
赋值 为 “1” 和 “2”; 在 “SEX” 变 量 中 将 | 六 -+ + 100% 
“ 男 ”和 “ 女 ”分 别 赋值 为 “1” 和 “0”， 国 卫 2， 43.3” 数据 文件 原 录 数据 
如 图 3-23 所 示 。 

在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 。 输入 后 部 分 数据 如 
图 3-24 所 示 。 
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起 中 SF.sav 堵 所 和 1] -IEM SPs Statistics 数 帮 


TB SPSS Statistics 处 理 生 了 吉 纤 | | [Unicode ON 


图 3-23 “3-3” 数 据 文件 的 变量 视图 


用 所 条 分 sav 承 项 拒 1] - IBM SPSS Statistics 天 也 六 呈 医 =- 0 x 


名 


| 
a 
S| 


46 
中 
2 
加 
本 
56 
Bl 
9 
到 
nn 
2) 
™ 
76 
7 
7 


TEN SPSS Statstics 地理 得 序 才 将 | Unicooe ON 


图 3-24 “3-3” 数 据 文件 的 数据 视图 


2. 实验 操作 步骤 


E07 打开 “3-3” 数 据 文件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 然 后 在 菜单 栏 中 选择 
“分 析 ”| “描述 统计 ”| “探索 ”命令 ， 打开“ 探索” 对话 框 。 

(GE362 将 变量 “Math” 选 入 “ 因 变 量 列表 ”列表 框 ， 将 “SEX” 选 入 “因子 列表 ”列表 框 ， 
将 “班级 ” 选 入 “个 案 标 注 依据 ”列表 框 。 

GES63 单 击 “统计 ”按钮 ， 在 弹出 的 “探索 ;统计 ”对 话 框 中 选中 “描述 ” 复 选 框 ， 单 击 

“图 ”按钮 ， 在 弹出 的 “探索 ， 图 ”对 话 框 中 选中 “ 箱 图 ”选项 组 的 “因子 级 别 并 
置 ” 单 选 按钮 “描述 ”选项 组 的 “ 茎 叶 图 ” 复 选 框 以 及 “ 含 检验 的 正 态 图 ” 复 选 框 。 

GES63 在 “探索 ”对 话 框 中 选中 “输出 ”选项 组 的 “两 者 ” 单 选 按钮 ， 然 后 单 击 “ 确 定 ” 
按钮 就 可 以 输出 探索 分 析 的 结果 。 


© 
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3. 实验 结果 及 分 析 


单 击 “ 确 定 ” 按 钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 3-25~ 图 3-31 所 示 。 
图 3-25 给 出 了 探索 分 析 中 的 变量 样本 数据 的 有 效 个 数 和 百分比 、 缺 失 个 数 和 百分比 及 合 
计 个 数 和 百分比 。 通 过 “个 案 处 理 摘要 ”可 以 看 出 本 实验 中 无 数据 缺失 。 


系数 ptt 


家 
33 1000% 33 100.0% 
47 100.0% 47 100.0% 


图 3-25 个 案 处 理 摘要 


图 3-26 给 出 了 数学 成 绩 按 照 性 别 分 类 的 一 些 统计 量 ， 如 均值 、 中 值 、 方 差 、 标 准 差 等 。 
通过 该 图 可 以 看 出 女生 数学 成 绩 均值 要 比 男生 大 ， 而 女生 数学 成 绩 中 值 却 小 于 男生 的 中 值 。 


不 均 做 
平均 全 的 95% 得 全 区 间 下 


5% 贡 险 后 下 为人 


平均 全 的 95% 午 信 区 同 


5% 郁 陡 后 二 汐 估 


图 3-26 变量 描述 


3-27 给 出 了 因 变 量 样本 数据 按照 因子 变量 分 类 的 正 态 性 检验 结果 。 列 中 “统计 ”表示 
检验 统计 量 的 值 ， “自由 度 df ”表示 检验 的 自由 度 ，“ 显 著 性 Sig.” 表 示 检 验 的 显著 水 平 。 
对 本 实验 而 言 ， 正 态 检验 的 原 假设 是 : 数据 服从 正 态 分 布 。 从 “正太 性 检验 ”中 柯 尔 莫 戈 洛 夫 
-斯 米 诺 夫 统计 量 、 夏 皮 洛 - 威 尔 克 统计 量 可 以 看 出 ， 女 生 和 男生 的 数学 成 绩 的 显著 水 平 都 大 于 
5%， 接 受 原 假设 ， 即 都 服从 正 态 分 布 。 

3-28 给 出 了 女生 数学 成 绩 的 茎 叶 图 。 图 中 “频率 ”表示 相应 数据 的 频数 ，“Stem” 即 
茎 ，“ 叶 ” 即 叶 子 ， 两 者 分 别 表示 数据 的 整数 部 分 和 小 数 部 分 ，“ 主 干 宽度 ”表示 茎 宽 。 
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1.00 Extremes (=<46) 
5.7 


100 6.4 

3.00 6. 678 

3.00 7. 234 

9.00 7. 566778899| 
4.00 8.2334 

7.00 8. 5566789 
2.00 9.24 

2.00 9.69 


正 态 性 检验 


柯 尔 英 站 洛 夫 -斯 来 语 夫 * 责 皮 党- 硬 尔 克 
撤 计 自由 应 显著 性 技 计 自由 应 县 著 性 


.097 33 200 3963 33 324 
.110 47 200 3971 47 291 
*, 这 是 真 显著 性 的 下 限 。 
妃 里 利 氏 显著 性 外 正 


主干 宽度 : 10 
每 人 时: 1 个 雪 


3-27 正 态 性 检验 3-28 ” 茎 叶 图 
图 3-29 和 图 3-30 分 别 给 出 了 女生 数学 成 绩 的 标准 Q-Q 图 和 趋 降 Q-Q 图 。 标 准 Q-Q 图 中 


的 观察 点 都 分 布 在 直线 附近 ， 趋 降 Q-Q 图 中 的 点 除了 极 个 别 点 外 都 分 布 在 0 值 横 线 附近 ， 因 
此 显示 样本 数据 服从 正 态 分 布 ， 这 个 结论 和 正 态 性 检验 的 结论 一 致 。 


数学 的 正 态 0 图 数学 的 去 趋势 正 坊 9Q-Q 图 
Sew- 妇 NFSExr 
| SR 
2 0 要 5 
a 
| 
i 六 o 
音 和 
| 
| 
汉 
加 加 库 如 EE 的 加 器 名 伽 
实 届 侍 实测 信 
图 3-29 标准 Q-Q 图 3-30 趋 降 标准 Q-Q 图 


图 3-31 给 出 了 按 因子 变量 性 别 区 分 的 数学 成 绩 的 箱 图 ， 其 中 箱 图 两 头 的 两 条 实 线 分 别 表 
示 最 大 值 和 最 小 值 ， 中间 的 黑色 实 线 表 示 中 位 数 ， 箱 体 的 上 下 两 端 为 四 分 位 数 。 在 本 实验 中 女 
生 数 学 成 绩 有 一 个 编号 为 1 的 异常 点 或 离 群 值 。 


ES | 


| 图 


居 汪 
| 


性 别 


图 3-31 箱 图 
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3.4 列 联 表 分 析 


列 联 表 分 析 可 以 进行 非 数值 性 变量 的 相关 性 分 析 , 在 理论 研究 和 实际 工作 中 具有 广泛 的 应 
用 。SPSS 的 交叉 表 分 析 过 程 可 以 方便 地 进行 列 联 表 分 析 ， 下 面 将 介绍 其 相关 操作 。 


3.4.1 列 联 表 分 析 简 介 


列 联 表 是 将 观测 数据 按 不 同属 性 进行 分 类 时 列 出 的 频数 表 。 列 联 表 分 析 常 用 于 分 析 离散 变 
量 的 名 义 变量 和 有 序 变量 是 否 相关 ， 在 市 场 调查 和 分 析 中 具有 广泛 的 应 用 。 
SPSS 的 交叉 表 分 析 过 程 可 以 对 计数 资料 和 某 些 等 级 资料 进行 列 联 表 分 析 ， 并 对 二 维和 多 
维 列 联 表 资料 进行 统计 描述 和 卡 方 检验 ， 并 计算 相应 的 百分数 指标 。 此 外 ，SPSS 的 交叉 表 分 
析 过 程 还 可 以 进行 费 希 尔 精 确 检验 、 对 数 似 然 比 检验 等 统计 检验 并 输出 相关 的 统计 量 。 下 面 是 
在 列 联 表 分 析 中 用 到 的 一 些 统计 量 。 
@ 总 体 分 布 检验 时 的 卡 方 检验 统计 量 。 计 算 公 式 如 下 : 
人 (3-11) 
所 ff 
式 中 此 为 子 集 个 数 ， 开 为 沙 入 第 i 个 子 集 的 实际 观测 值 频数 ，EE, 是 落 入 第 i 个子 集 的 理论 
频数 ， 它 等 于 变量 值 落 入 第 i 个子 集 的 频率 p，( 按照 假 设 的 总 体 分 布 计算 ) 与 观测 值 个 数 的 
乘积 EE, =np, ， 如 果 分 布 的 假设 为 真 ， 则 统计 量 妇 服 从 自由 度 为 上 -1 的 卡 方 分 布 。 注 意 : 一 
般 要 求 ,大 于 5， 如 果 不 满 足 要 求 ， 可 以 与 相 邻 子 集合 并 。 
@ 列 联 分 析 中 的 卡 方 检验 统计 量 。 计 算 公式 如 下 
= (3-12) 
i=] j=1 
式 中 上 为 列 联 表 行 数 ，r 为 列 联 表 列 数 ， 态 为 观测 频数 ， 名 为 期 望 频数 。 如 果 行 列 间 的 
变量 是 相互 独立 的 ， 则 统计 量 X 服从 自由 度 为 和 -D0 一 DD) 的 卡 方 分 布 。 
图 似 然 比 统计 量 。 似 然 比 卡 方 统计 量 适用 于 名 义 尺度 的 变量 ， 其 统计 量 为 : 


i 
7T=2y fn 志 (3-13) 

i E; 
式 中 的 字母 含义 同 卡 方 统计 量 。 当 样本 很 大 时 , 与 卡 方 统 计量 接近 , 检验 结论 与 卡 方 检验 

是 一 致 的 。 
@ 列 联系 数 。 列 联系 数 适用 于 名 义 尺度 的 变量 ， 其 统计 量 为 : 

C= 万 (3-14) 

和 十 下 


她 含 义 见 卡 方 检验 统计 量 ，z 为 样本 容量 。 列 联系 数 趋 于 1 时 ， 两 类 变量 相关 程度 越 好 。 
@ Ph 系数 。Ph; 系数 适用 于 名 义 尺度 的 变量 ， 其 统计 量 为 : 
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gp= | 全 (3-15) 
Ph 系数 是 对 x? 统计 量 的 修正 。 


3.4.2 ” 列 联 表 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 建立 一 个 数据 文件 后 ， 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 进 


行列 联 表 分 析 。 CE 
1) 在 SPSS Statistics 数据 编辑 器 窗口 的 菜单 栏 一 Eee 
中 选择 “分 析 ”| “描述 统计 ”| “交叉 表 ” 命令 , 打 | 凶 -一 
开 如 图 3-32 所 示 的 “交叉 表 ” 对 话 框 。 本 
| 一 
在 源 变量 列表 框 中 选择 行 变量 ， 然 后 单 击 畏 按 i 
钮 将 选中 的 变量 先入 右 侧 “ 行 ”列表 框 中 ， 将 列 变 | 
量 先 入 右 侧 “ 列 ”列表 框 中 ， 如 果 有 分 层 变 量 ， 则 ， 四 | 
将 其 选 入 右 侧 的 “ 层 1” 列 表 框 中 。 Dare ks 
@“ 行 ”列表 框 。 该 列表 框 中 的 变量 为 交叉 分 | CE] we 区 加 区 加 区 加 
的 行 2 一 般 ; J 变量 或 字 
edi 变量 的 属性 一 般 为 数值 型 变量 或 字 有 和 


@“ 列 ”列表 框 。 该 列表 框 中 的 变量 为 交叉 分 析 表 的 列 变量 , 变量 的 属性 一 般 为 数值 型 变 
量 或 字符 型 变量 。 

@@“ 层 W1” 列 表 框 。 该 列表 框 中 的 变量 为 交叉 表格 分 析 中 分 层 变量 ， 该 变量 主要 用 于 对 
频数 分 布 表 进行 分 层 , 对 每 一 层 都 可 以 进行 行 和 列 的 交叉 表格 分 析 。 如 果 需 要 加 入 新 的 分 层 变 
量 , 单 击 “ 下 一 页 ”按钮 ; 如 果 需 要 修改 已 经 加 入 的 分 层 变 量 , 单 击 “ 上 一 页 ”按钮 返回 即 可 。 


3) 进行 相应 的 设置 。 起 有 9i 验 x 

“精确 检验 ”设置 em 

单 击 “精确 ”按钮 ， 弹 出 如 图 3-33 所 示 的 “精确 检 。 ”Ra a 
验 ”对 话 框 。 et 1o000 

该 对 话 框 主要 用 于 设置 计算 显著 性 水 平 的 方法 ,有 3 A 2 
种 方法 。 在 计算 限制 允许 时 ， 净 使 用 精确 方法 代 普 莹 特 卡 洛 法 

@ 仅 渐进 法 。 适 用 于 具有 渐进 分 布 的 大 样本 数据 ，。 | 下越 访 关 名 We ie 
基于 统计 量 的 渐进 分 布 计算 相 应 的 显著 性 水 平 〈 显 著 3 
性 ) ， 当 输出 的 显著 性 水 平 低 于 临界 值 时 ， 认 为 是 显著 | | 
的 且 可 以 拒绝 原 假设 。 图 3-33 “精确 检验 ”对 话 框 


@ 蒙特 卡 洛 法 。 该 方法 不 需要 样本 数据 具有 渐进 分 布 的 前 提 假 设 ， 为 精确 显著 性 水 平 的 
无 偏 估计 ， 是 非常 有 效 的 计算 确切 显著 性 水 平 的 方法 。 在 “置信 度 级 别 ” 文本 框 中 输入 置信 水 
平 来 确定 置信 区 间 的 范围 (默认 是 99%) ， 在 “样本 数 ”文本 框 中 输入 样本 的 抽样 次 数 〈 默 
认 是 10000 次 ) 。 
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@ 精确 。 表 示 给 定时 间 限制 下 计算 统计 量 的 显著 水 平 。 Ga | 
(显著 性 ) ， 一 般 在 给 定时 间 限 制 的 情况 下 ， 使 用 精确 方法 rr 
代替 蒙特 卡 洛 估计 法 。 另 外 ， 对 于 非 渐进 方法 ， 计 算 检 验 统 es 
计量 时 ， 总 是 将 单元 格 计数 四 合 五 入 或 舍 位 。 系 统 默认 的 精 es | 
确 检验 方法 为 “ 仅 渐进 法 ”。 | 

“统计 ”设置 el 

单 击 右 侧 “统计” 按钮 ,弹出 如 图 3-34 所 示 的 “交叉 表 : Sam 
统计 ”对 话 框 。 ee 

“交叉 表 : 统计 ”对 话 框 用 于 设置 输出 的 统计 量 。 各 先 (ea) Coa CR) 

项 (统计 量 ) (组 ) 含义 介绍 如 下 。 图 3-34 “交叉 表 ， 统计 ”对 话 框 


GD 卡 方 。 选 中 该 复 选 框 ， 表 示 对 行 变量 和 列 变量 的 独立 性 进行 卡 方 检验 。 

@ 相 关 性 。 主 要 对 变量 进行 相关 系数 检验 ， 包 括 斯 皮尔 曼 相关 系数 检验 和 Person 相关 系 
数 检验 。Person 相关 系数 检验 是 按 区 间 检 验 ， 斯 皮尔 曼 相关 系数 检验 则 是 按照 顺序 检验 。 

@ Kappa。 主要 通过 输出 Cohen's Kappa 统计 量 来 衡量 对 同一 对 象 的 两 种 评估 是 否 具有 一 
致 性 ， 取 值 范 围 为 0~1，1 表示 完全 一 致 ，0 表示 完全 不 一 致 。 该 统计 量 仅仅 适用 于 行 变量 和 
列 变 量 取 值 个 数 和 范围 一 致 时 的 情况 。 

@ 风险 。 用 来 衡量 某 事 件 〈 行 变量 ) 对 某 因素 〈 列 变量 ) 的 影响 大 小 。 建 议 仅 对 无 空 单 
元 格 的 二 维 表 计 算 。 

@ 麦克 尼 马 尔 。 通 过 输出 麦克 尼 马 尔 -Bowker 统计 量 来 对 二 值 变量 的 非 参数 检验 ， 利 用 
卡 方 分 布 对 响应 变化 进行 检验 ， 如 可 以 用 来 检验 车 祸 前 和 车 祸 后 ,司机 对 安全 意识 的 变化 。 该 
检验 仅仅 在 行 变 量 和 列 变 量 相等 时 才 可 以 做 。 

@ 柯 克 兰 和 曼 特 尔 - 享 塞 尔 统计 。 该 复 选 框 是 对 一 个 二 值 因素 变量 和 一 个 二 值 响应 变量 的 
独立 性 进行 检验 ， 在 “检验 一 般 比 值 比 等 于 ”文本 框 中 输入 一 个 正 数 〈 默 认为 1) 。 

@ “名 义 ” 选 项 组 。 该 选项 组 主要 用 于 名 义 变量 统计 量 的 定制 ， 包 括 4 个 复 选 框 。 


。 列 联系 数 : 表示 基于 卡 方 检验 的 相关 性 的 检验 ， 取 值 在 0~ 1 之 间 ，0 表示 完全 不 相关 ， 
1 表示 完全 相关 。 

。 Phi 和 克 莱 姆 V: 同样 是 两 个 表示 相关 性 的 检验 统计 量 。 

。 Lambda: 对 有 序 变量 相关 性 的 度量 ， 取 值 在 -1~ 1 之 间 ，-1 表示 完全 负 相 关 、1 表示 完全 
正 相 关 ，0 表示 完全 不 相关 。 

。 不 确定 性 系数 : 表示 用 一 个 变量 预测 其 他 变量 时 的 预测 误差 降低 比例 ， 取 值 在 0~1 之 间 ， 
0 表示 完全 不 能 预测 ，1 表示 预测 完全 准确 。 


“有 序 ” 选 项 组 。 该 选项 组 用 于 有 序 变量 统计 量 的 定制 ， 包 括 4 个 复 选 框 。 


。 Gamma: 该 统计 量 是 对 两 个 有 序 变量 相关 性 的 对 称 度量 ， 取 值 在 -1 ~ 1 之 间 ，-1 表示 变量 
之 间 完 全 负 相 关 ，1 表示 完全 正 相 关 ，0 表示 完全 无 关 。 

。 萨 默 斯 d: 该 统计 量 是 对 两 个 有 序 变量 相关 性 的 非 对 称 度量 ， 取 值 在 -1 ~1 之 间 ，-1 表示 
变量 之 间 完 全 负 相 关 ，1 表示 完全 正 相 关 ，0 表示 完全 无 关 。 
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。 肯 德 尔 tau-b: 该 统计 量 是 对 有 序 变 量 相关 性 的 非 参数 检验 ， 取 值 在 -1~ 1 之 间 ，-1 表示 变 
量 之 间 完 全 负 相 关 ，1 表示 完全 正 相关 ，0 表示 完全 无 关 。 
。 肯 德 尔 tau-c: 该 统计 量 同样 是 对 有 序 变 量 相关 性 的 非 参 数 检 验 ， 不 过 计算 时 不 考虑 相同 


的 观测 值 ， 取 值 同样 在 -1 ~1 之 间 。 


@ “ 按 区 间 标 定 ” 选 项 组 。 该 选项 组 用 于 检验 一 个 连续 变量 和 一 个 分 类 变量 的 相关 性 ， 
仅 有 一 个 Eta 复 选 框 ,输出 的 是 两 个 值 ， 分 别 将 列 变 量 和 行 变量 作为 因 变 量 进行 计算 , 取 值 在 


0~1 之 间 ，0 表示 完全 不 相关 ，1 表示 完全 相关 。 


瞧 交叉 去 : 单元 想 呈 示 3 
“单元 显示 ”设置 [这 | 
单 击 右 侧 的 “单元 格 ” 按 钮 ， 弹 出 如 图 3-35 所 示 TF MBE 国 ip 值 (大 下 伦 尼 法 ) 外 
的 “交叉 表 : 单元 格 显示 ”对 话 框 。 De 
“交叉 表 : 单元 格 显示 ”对 话 框 用 于 设置 输出 的 [本 2 比 焉 和 
Ei) 日 未 村 化 
统计 量 。 Ec) 口 标准 化 GS) 
Dt 口 调 明 所 有 化 
@D “计数 ”选项 组 。 该 选项 组 用 于 对 输出 的 观测 。 ew 和 


值 数量 进行 设置 ， 包 括 3 个 复 选 框 : “实测 ”表示 按 回 单元 格 计 才 四 全 五 AN) 加 个 实权 重 四 全 五 AN 

照 变量 观测 值 的 实际 数目 显示 ， “期望 ”表示 输出 的 Oil 

是 期 望 的 观察 值 数目 ; 若 选中 “隐藏 较 小 的 计数 (H) ” ren 

复 选 枉 ， 且 在 “小 于 ”文本 框 中 输入 数字 ， 将 隐藏 小 


于 该 数 的 计数 。 


CO 者 i 单元 格 计 数 LL) 。。 〇 〇 萌 厅 个 过 权 重 (H) 


图 3-35 “交叉 表 : 单元 格 显示 ”对 话 框 


@ “百分比 ”选项 组 。 该 选项 组 用 于 对 百分比 进行 设置 ， 包 括 3 个 复 选 框 : “ 行 ”表示 
要 输出 行 方向 的 百分比 ; “ 列 ” 表 示 要 输出 列 方向 的 百分比 ;: “总 计 ” 表 示 要 输出 行 或 列 方向 


总 的 百分比 。 


@@ “Z- 检 验 ” 选 项 组 。 该 选项 组 用 于 检验 表 中 每 列 的 比例 是 否 相等 ， 可 设置 输出 拜 弗 伦 


尼 校 正 后 的 检验 显著 性 。 


图 “ 残 差 ”选项 组 。 该 选项 组 用 于 对 残 差 进行 设置 ， 包 括 3 个 复 选 框 “未 标准 化 ” 表 
示 输 出 的 残 差 没有 经 过 标准 化 处 理 ， 为 原始 残 差 ; “标准 化 ”表示 输出 的 残 差 是 经 过 标准 化 处 
理 后 的 残 差 ， 即 原始 残 差 除 以 标准 差 后 的 残 差 ; “调整 后 标准 化 ”表示 输出 的 是 经 过 标准 误差 


调整 之 后 的 残 差 。 


@@ “ 非 整 数 权重 ”选项 组 。 该 选项 组 用 于 对 加 权 处 理 的 非 整数 频数 进行 取 整 的 设置 ， 有 


5 种 方法 : 


不 调整 ， 表 示 不 对 频数 做 任何 调整 
“格式 ”设置 


单元 格 计数 四 含 五 入 ， 表 示 对 加 权 处 理 后 的 频数 进行 四 舍 五 入 取 整 。 
个 案 权重 四 舍 五 入 ， 表 示 对 加 权 处 理 前 的 频数 进行 四 含 五 入 取 整 。 
截断 单元 格 计数 ， 表 示 对 加 权 处 理 后 的 频数 进行 截断 含 位 取 整 。 
截断 个 案 权重 ， 表 示 对 加 权 处 理 前 的 频数 进行 截断 舍 位 取 整 。 


单 击 右 侧 的 “格式 ”按钮 ， 弹 出 如 图 3-36 所 示 的 “交叉 表 : 表格 式 ” 对 话 框 。 该 对 话 框 


用 于 设置 输出 结果 的 显示 顺序 。 
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4) 分 析 结 果 输 出 
设置 完毕 后 , 单 击 “ 确定 ”按钮 ,就 可 以 在 SPSS Statistics 
查看 器 窗口 得 到 交叉 表格 分 析 的 结果 。 


3.4.3 ”实验 操作 


下 面 将 以 数据 文件 “3-4” 为 例 ， 说 明 交 叉 表 格 分 析 的 
具体 操作 过 程 。 


1. 实验 数据 描述 


数据 文件 “3-4” 来 源 于 山东 人 民 出 版 社 出 版 的 《常用 统计 分 析 方法 》。 调 研 人 员 为 了 调 
查 男性 和 女性 购车 者 在 购车 方面 的 观点 , 调查 了 一 百名 购车 人 , 分 析 性 别 对 安全 措施 的 偏好 是 
否 有 联系 。 其 中 ， 数 据 文件 提供 的 安全 措施 有 “ABS 刹车 ”“ 改 良 悬 架 ”“ 气 伐 ”“ 自 动 门 
锁 ” 和 “电路 控制 ”。 原 始 Excel 数据 文件 如 图 3-37 所 示 。 

在 SPSS 的 变量 视图 中 ， 建 立 “ 安 全 措施 ”与 “性 别 ” 变 量 ， 分 别 表示 购车 者 最 注重 的 安 
全 措施 和 购车 者 的 性 别 ， 如 图 3-38 所 示 。 


日 


图 3-36 “交叉 表 : 表格 式 ” 对 话 框 


Fei so 1] -EM spss Suatistics RBG oe] 
jE】 二 看 轴 。 着 括 D) 革 中 分析 直 岗 册 。 阳 HG) 冯 用 乞 U】 六 寺 C) 一 DQ 大 用) 


Era 
人 LABS 刊 无 证 性 右 信 仔 广 \ 姓 入 
F 全 ] 无 日 潭 丰 AHE AS 的 入 


六 
年 


S 
导 
五 
BE 
党 
对 着 泗 汝 沽 酒 茹 类 洒 关 类 泛 妆 类 酒 攻 四 


四 
刘 
注 
当 


由 1 
L 于 加 加- 于 + 100% SPSS Setc 外 香 短 取 吕 缚 | | Unicode ON 


图 3-37 “3-4” 原 始 数据 文件 图 3-38 “3-4” 数 据 文件 的 变量 视图 


在 SPSS 活动 数据 文件 中 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 。 其 中 ， 在 “安全 措 
施 ” 变 量 中 将 “ABS 和 刹车 ”“ 改 良 悬 架 ”“ 和 气 袋 ” “自动 门 锁 ” 和 “电路 控制 ”分 别 赋值 为 
“1”“2”“3w” “4” 和 “5”; 在 “性 别 ”变量 中 将 “ 男 ” 和 “ 女 ” 分 别 赋值 为 “1” 和 “0”。 
输入 完毕 后 的 部 分 数据 如 图 3-39 所 示 。 

2. 实验 操作 步骤 


人 GE) 打开 “3-4” 数 据 文件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 描 述 统计 ”|“ 交 叉 表 ” 命 令 ， 打 开 “ 交 叉 表 ”对 话 框 。 
E02 将 “性 别 ”变量 选 入 “ 行 ”列表 框 ， 将 “安全 措施 ” 选 入 “ 列 ” 列 表 框 。 
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Wes Re BM 5p55 Statistics HERSE a 


BM SPSS Sabstics 处 理科 订 流 壤 | | |Unicode ON | 
图 3-39 “3-4” 数 据 文件 的 数据 视图 
(GE363 单 击 “ 精 确 ”按钮 ， 在 弹出 的 “精确 检验 ”对 话 框 中 选中 “ 仅 渐 进 法 ” 单 选 按钮 ; 
单 击 “ 统 计 ” 按 钮 ， 在 弹出 的 “交叉 表 : 统计 ”对 话 框 中 选中 “ 卡 方 ” 复 选 框 ， 单 
击 “ 单 元 格 ”按钮 ， 在 弹出 的 “交叉 表 : 单元 格 显示 ”对 话 框 中 选中 “实测 ” 复 选 
框 和 “单元 格 计数 四 售 五 入 ” 单 选 按钮 单 击 “格式 ”按钮 ， 在 弹出 的 “交叉 表 ; 
表格 式 ” 对 话 框 中 选中 “升序 ” 单 选 按钮 。 
(GE365 在 “ 交 又 表 ” 对 话 框 中 选中 “显示 簇 状 条 形 图 ” 复 选 框 ， 然 后 单 击 “ 确 定 ”按钮 即 
可 输出 交叉 表格 分 析 的 结果 。 


3. 实验 结果 及 分 析 


SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 3-40~ 图 3-43 所 示 。 
图 3-40 给 出 了 交叉 表格 分 析 中 的 变量 样本 数据 的 有 效 个 数 和 百分比 、 缺 失 个 数 和 百分比 
合计 个 数 和 百分比 。 通 过 “个 案 处 理 摘要 ”可 以 看 出 本 实验 中 无 数据 缺失 。 


图 3-40 ”个案 处 理 摘要 


图 3-41 给 出 了 性 别 对 安全 措施 的 二 维 交叉 表格 ， 每 个 单元 格 中 都 给 出 了 每 种 组 合 的 实际 
频数 ， 即 对 原始 数据 的 表示 。 通 过 “性 别 * 安 全 措施 交叉 表 ” 可 以 看 出 样本 数据 中 女性 有 5 人 
选择 了 ABS 刹车 ， 男 性 有 15 人 选择 了 ABS 刹车 ， 总 共有 20 人 选择 了 ABS 刹车 。 

性 出 “安全 措施 交叉 表 


图 3-41 性 别 * 安 全 措施 交叉 表 
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图 3-42 给 出 了 对 行 变 量 和 列 变量 是 否 独立 的 卡 方 检验 。 对 于 本 实验 而 言 ， 卡 方 检验 的 原 
假设 是 : 不 同性 别 对 选择 安全 措施 无 显著 影响 。“ 值 ”表示 检验 统计 量 的 值 , “自由 度 ” 表 示 
检验 的 自由 度 , “渐进 显著 性 〈 双 侧 ) ”表示 双 侧 检验 的 显著 水 平 。 从 “ 卡 方 检验 表 ” 可 以 看 
出 ， 皮 尔 逊 卡 方 检验 、 似 然 比 检验 、 线 性 和 线性 组 合 检验 都 显示 为 0.001， 显 然 拒 绝 原 假 设 ， 
即 认为 性 别 对 选择 安全 措施 有 显著 的 影响 ， 女 性 和 男性 在 选择 安全 措施 方面 显著 不 同 。 

图 3-43 给 出 了 按 性 别 分 类 的 频数 分 布 条 形 图 ， 条 形 图 中 给 出 了 相应 性 别 选择 不 同安 全 措 
施 的 频数 。 通 过 “条 形 图 ”可 以 看 出 不 同 的 性 别 对 安全 措施 的 选择 显著 不 同 ， 如 女性 选择 最 多 
的 安全 措施 是 自动 门 锁 ， 而 男性 选择 自动 门 锁 的 人 数 则 最 少 。 


条 形 图 


国 改良 巡回 
目 ， 

国 白马 门 包 
Di 


皮条 澡 书 为 ”19.000* 


似 然 比 (LU) 19.967 001 
拭 性 关联 11.472 001 
有 效 个 案 数 100 


3.0 个 单元 格 (0.0%) 的 期 望 计数 小 于 5。 最 小 期 
望 计数 为 5.00。 


图 3-42 卡 方 检 验 图 3-43 条 形 图 


3.5 比率 分 析 


比率 分 析 , 又 称 为 比率 统计 量 过 程 , 它 提供 了 一 个 描述 两 个 数值 变量 间 比 率 的 摘要 统计 量 
的 综合 列表 。 


3.5.1 比率 分 析 简 介 


该 分 析 不 仅 可 以 提供 中 位 数 、 均 值 、 加 权 均 值 、 范 围 、 最 小 和 最 大 值 等 基本 统计 指标 ， 还 
可 以 提供 离 差 系数 〈COD) ， 以 均值 为 中 心 的 变异 系数 ， 价 格 相关 微分 (PRD ) ， 标 准 差 ， 
平均 绝对 偏差 (AAD) ， 对 用 户 指定 的 范围 或 中 位 数 比率 中 的 百分比 所 计算 的 集中 指数 等 。 
如 果 对 某 城市 不 同 地 段 房产 的 估价 和 实际 售 价 之 间 的 差异 感 兴趣 ， 就 可 以 利用 SPSS 24.0 提供 
的 比率 统计 量 进行 分 析 。 


3.5.2 ”比率 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 
进行 比率 分 析 。 
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1) 在 菜单 栏 中 选择 “分 析 ”|“ 描 述 统计 ”|“ 比 
率 ” 命 令 , 打开 图 3-44 所 示 的 “比率 统计 ”对 话 框 。 

2) 选择 变量 。 

对 话 框 右 侧 有 3 个 文本 框 。 


。 分 子 : 该 文本 框 中 的 变量 为 比率 分 析 中 需要 
计算 比率 统计 量 的 分 子 部 分 ， 分 子 变 量 的 度 
量 标准 一 般 为 度量 变量 ( 刻度 变量 ) ， 且 必 
须 取 正 值 。 

。 分 母 : 该 文本 框 中 的 变量 为 比率 分 析 中 需要 
计算 比率 统计 量 的 分 母 部 分 分母 变量 的 度 
量 标准 也 是 度量 变量 (或 者 说 刻度 变量 ) ， 


上 必须 取 正 值 。 图 3-44 “比率 统计 ”对 话 框 
e 组 变量 : 该 文本 框 中 的 变量 为 比率 分 析 中 进行 分 组 的 变量 ， 一 般 是 名 义 或 序数 度量 ,使 用 
数值 代码 或 字符 串 以 对 分 组 变量 进行 编码 。 
从 源 变量 列表 框 中 选择 相应 的 “分 子 ”“ 分 母 ” 及 “组 变量 ”， 以 图 3-44 中 的 变量 为 例 ， 
如 图 3-45 所 示 。 
3) 进行 相应 的 设置 。 


“统计 ”设置 
单 击 右 下 角 的 “统计 ”按钮 ， 弹 出 如 图 3-46 所 示 的 “比率 统计 : 统计 ”对 话 框 。 
入 txtit: 纹 计 x 
集中 相交 高 艇 
回 阳 他 数 和 mp 已 标 人 差 (3) 
回 平均 值 U) 图 cop be) 
四 加 梭 平均 从 QD PED 局 二) 
口 轨 信 区 辣 E): 中 位 数 居 中 COY 。。 回 最 大 什 0 
NE 月 的 从 居中 COVD 
Township flown] - 
@ Assessorlassessonl 集中 指标 
2 rear sinee astappr-| | | [RR 7 两 人 尼 例 之 则 中 位 数 百分比 之 内 
会 HU: 中 位 孝 百 分 比 (N): | 
高 ttBH): 
对 加: 下 分 KG): 
二 E> 
和 Ez) 
En sw) 
Sd 
[ET EDEN 
3-45 “比率 统计 ”对 话 框 图 3-46 “比率 统计 : 统计 ”对 话 框 


“比率 统计 : 统计 ”对 话 框 主要 用 于 设置 需要 输出 的 统计 量 ， 包 括 3 个 选项 组 。 
中 “集中 趋势 ”选项 组 。 该 选项 组 用 于 描述 比率 分 布 的 集中 趋势 : 
。 中 位 数 ， 表 示 小 于 该 值 的 比率 数 与 大 于 该 值 的 比率 数 相等 ; 
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。 平均 值 ， 表 示 比 率 的 总 和 除 以 比率 的 总 数 所 得 到 的 结果 ; 
。 加 权 平均 值 ， 表 示 分 子 的 均值 除 以 分 母 的 均值 所 得 到 的 结果 ， 也 是 比率 按 分 母 加 权 之 后 的 
均值 ; 
e 置信 区 间 ， 表 示 用 于 显示 均值 、 中 位 数 和 加 权 均 值 的 置信 区 间 ， 取 值 范围 是 0~ 100。 
@ “离散 ”选项 组 。 该 选项 组 中 的 统计 量 主要 用 于 测量 观察 值 中 的 变 差 量 或 分 散 量 ， 包 
括 9 个 统计 量 : 


。 AAD， 即 平均 绝对 偏差 ， 表 示 中 位 数 比率 的 绝对 离 差 求 和 并 用 值 除 以 比率 总 数 所 得 的 值 ; 

。 COD， 即 离 差 系数 ， 将 平均 绝对 偏差 表示 为 中 位 数 的 百分比 的 值 ; 

。 PRD， 即 价格 相关 微分 ， 也 称 为 回归 指数 ， 表 示 均 值 除 以 加 权 均 值 所 得 到 的 值 ; 

。 中 位 数 居 中 COV， 即 中 位 数 居 中 的 方差 系数 ， 将 与 中 位 数 偏差 的 均 方 根 表示 为 中 位 数 百 
分 比 的 值 ; 

。 平均 值 居 中 COV， 即 均值 居中 的 方差 系数 ， 将 标准 差 表示 为 均值 百分比 的 值 ; 

。 标准 差 ， 表示 比率 与 比率 均值 间 偏 差 的 平方 之 和 ， 再 除 以 比率 总 数 减 一 ， 取 正 的 平方 根 所 
得 到 的 值 ; 

。 范围 ， 表 示 数 据 中 最 大 的 比率 减 去 最 小 的 比率 所 得 的 值 ; 

。 最 小 值 ， 即 最 小 的 比率 ; 

。 最 大 值 ， 即 最 大 的 比率 。 


@ “集中 指标 ”选项 组 。 该 选项 组 用 于 度量 落 在 某 个 区 间 中 的 比率 的 百分比 ， 包 括 两 个 
文本 框 : 


。 低 比 例 ， 表 示 指 定 度量 区 间 的 最 低 比率 值 ， 一 般 指 定 小 于 1。 
。 高 比例 ， 表 示 指 定 度量 区 间 的 最 高 比率 值 ， 一 般 指 定 大 于 1。 


如 果 设 置 了 低 比 例 和 高 比例 的 值 ， 再 单 击 “ 添 加 ”按钮 ， 则 将 计算 这 一 对 集中 指数 。 
图 “中 位 数 百分比 之 内 ”选项 组 。 该 选项 组 通过 指定 中 位 数 的 百分比 而 隐 式 定义 区 间 大 小 ， 
取 值 范围 为 0-100， 计 算 区 间 下 界 为 〈1-0.01* 值 ) * 中 位 数 ， 上 界 为 〈1+0.01* 值 ) * 中 位 数 。 


按 组 变量 排序 
选中 该 复 选 框 , 表示 输出 结果 将 按照 组 变量 的 顺序 排序 。“ 升 序 ” 表 示 按 组 变量 升序 排序 ; 
“降序 ”表示 按 组 变量 降序 排序 。 


显示 结果 

选中 该 复 选 框 ， 表 示 仅 在 SPSS Statistics 查看 器 窗口 得 到 比率 分 析 的 结果 。“ 将 结果 保存 
到 外 部 文件 ” 复 选 框 , 表示 可 以 将 比率 分 析 的 结果 以 其 他 文件 形式 保存 ， 可 以 单 击 该 复 选 框 下 
方 的 “文件 ”按钮 进行 保存 ， 如 图 3-47 所 示 。 

4) 分 析 结果 输出 

设置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 比率 分 析 的 结果 。 
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[ [= tpt A :保存 到 I 件 x 
REO: Cel 
HE 分 析 sa 
Xe |[ | are) 
保存 类 到 中 : [SPSS Sms (sm) 司 EN 


3-47 ”将 分 析 结果 保存 到 外 部 文件 


3.5.3 ”实验 操作 
下 面 将 以 “3-5” 数 据 文件 为 例 ， 说 明 比 率 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 解 释 。 
1. 实验 数据 描述 
“3-5” 数 据 文件 来 源 于 SPSS 24.0 自 带 的 数据 文件 property_assess.sav， 该 假设 数据 文件 
涉及 某 县 资产 评估 员 资 产 价值 评估 方面 的 记录 , 下 面 将 利用 比率 分 析 来 评估 该 县 5 个 地 点 相 比 
上 次 资产 评估 后 资产 价值 的 变化 。 个 案 对 应 过 去 一 年 中 县 里 所 出 售 的 资产 。 数 据 文件 中 的 每 个 


个 案 记 录 资 产 所 在 的 镇 、 最 后 评估 资产 的 评估 员 、 该 次 评估 距 今 的 时 间 、 当 时 的 估价 及 资产 的 
出 售 价格 。 原 始 Excel 数据 文件 如 图 3-48 所 示 。 


[dals el Cia | ER 
1 | 六 号 堪 太 六 本 评 售 员 编号 资产 的 出 售 价格 《万 ) 上 次 信 价 (万 】 该 次 评 舍 距 今 的 时 间 (月 ) | 
| 1 4 16 110.6 107 1 

| 二 国 到 3 1 171.4 104.8 

| EE 1 7 276.5 209 
5| 4 3 io 273.6 179. 8 
6 5 1 2 175.1 156.4 
2 3 16 258.6 146.5 
| 7 4 6 四 86.4 4 
9| 8 4 16 98.8 1.9 

lo 9 2 1 195.1 167 
40 10 5 11 141.3 127.8 

lal 1 5 8 116 116.8 5 

el 12 3 了 251.5 95.2 1 
14| 13 1 4 TT. 4 225.7 
15| 14 2 名 223. 2 226. 6 1 

lel 15 5 6 168.9 164.9 

Bzl_ 1 13 115.5 104.4 

property assess | 一 oi = 
谣 绪 有 回 加 0 + 100% 


图 3-48 “3-5” 数 据 文件 原始 数据 


在 SPSS 变量 视图 中 建立 变量 “propid”“town”“assessor”“saleval” “lastval” “time”， 
分 别 表示 记录 的 资产 、 资产 所 在 的 镇 、 最 后 评估 资产 的 评估 员 、 当时 的 估价 及 资产 的 出 售 价格 、 
该 次 评估 距 今 的 时 间 ， 如 图 3-49 所 示 。 


97 


SPSS 统计 分 析 从 入 门 到 精通 (第 四 版 ) 


部 分 数据 如 图 3-50 所 示 。 
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答 property assesssav PEE1] -IBM SPSS Statistics BBS 


六 插口。 所 加 豆 看 WV 妆 把 D) 半 筑 中 分 折 风 下 请 Wl(E)】 六 用 本 LJ) 扩展 中 亩 DQD 项 二 H) 


| 到 | | 下 


二 右 
要 训 
等 右 
笃 圳 
EE 


三 吉 


19M SPSS Stabshcs 处 于 入 办 幸 | 


信和 
语义 条 入 
PRE NWA 
FR 和 
HE VM 和 
FR VA 


Uneooe ON 


3-49 “3-5” 数 据 文件 的 变量 视图 
然后 在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 搜集 的 数据 输入 到 各 个 变量 中 ,输入 完毕 后 


和 ropery_ ewess nv 现时 1 -EM SPSS Statistics 找 避 大 
文件 中。 志 醒 {E) 硬 看 QD 直 据 吕 ) 半袖 分析 由。 到 稍 W) 隐 孙 (@) 交 肌 入 六 时 0Q) 调 DQID。 大 号 H) 


= 


2. 实验 操作 步骤 
有 具体 操作 步骤 如 下 。 


图 3-50 “3-5” 数 据 文 件 的 数据 视图 


GE56) 打开 “3-5” 数 据 文件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 


析 ”|“ 描 述 统计 ”| “ 比 
“分 子 ” 将 saleval 选 入 “分 母 ” 


率 ” 命 令 ， 打 开 图 “比率 统计 ”对 话 框 。 然 后 将 lastval 选 入 
将 “town” 选 入 “组 变量 ”。 


本 702 单 击 “统计 ”按钮 ， 在 弹出 的 “比率 统计 : 统计 ”对 话 框 中 选中 “集中 趋势 ”选项 
组 的 “平均 值 ” 复 选 框 ， 选 中 “离散 ”选项 组 的 PRD 和 “平均 值 居 中 COV” 复 选 
框 ， 在 “集中 指标 ”选项 组 的 “ 低 比 例 ” 文 本 框 


输入 1.2， 


输入 0.8， 在 “高 比例 ”文本 框 中 


并 单 击 “ 添 加 ”按钮 ， 最 后 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 结果 
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GE563 单 击 “确定 ”按钮 ， 执 行 比率 分 析 。 
3. 实验 结果 及 分 析 
单 击 “ 确 定 ” 按 钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 3-51 和 图 3-52 所 示 。 


个 案 处 理 摘要 
计数 百分比 
Township “Eastern 177 17.7% 
Central 187 18.7% 
ER 205 8% 组 均值 | 价格 相关 检 中 位 数 居 值 》 
Northem 220 22.0% Eastem 860 1013 16.4% 67.2% 
Westem 211 21.1% Central 899 1010 158% 75.9% 
总 体 1000 100.0% Southem 759 1027 262% 36.1% 
Norhem 959 1004 90% 95.9% 
排除 0 Westem 805 1002 151% 55.5% 
总 计 1000 总体 857 1.025 18.2% 66.3% 
图 3-51 个 案 处 理 摘要 3-52 lastval/saleval 的 比率 统计 量 
3-51 给 出 了 “3-5” 数 据 文件 的 个 案 处 理 摘要 ， 从 中 可 以 看 出 该 县 5 个 地 点 资产 的 数目 
和 相应 的 百分比 情况 。 


图 3-52 给 出 了 lastval/saleval 的 各 个 比率 统计 量 数值 ， 从 中 可 以 得 到 每 个 地 点 资产 价值 上 
次 评估 值 与 售 价 之 间 比 率 的 均值 、 价 格 相关 微分 、 均 值 居中 的 方差 系数 和 百分比 介 于 0.8 和 1.2 
之 间 的 集中 系数 。 具 体 而 言 ， 可 以 发 现 每 个 地 点 的 比率 均值 都 小 于 1， 可 见 售 价 都 小 于 资产 价 
值 的 上 次 评估 价值 ; 价格 相关 微分 都 略 大 于 1， 表示 资 产 价值 的 比率 均值 与 比率 权重 均值 相差 
不 大 ; 南部 的 均值 居中 方差 系数 最 大 ,表示 南部 的 资产 价格 评估 值 与 售 价 之 间 的 比率 变动 最 大 ; 
北部 的 集中 系数 最 大 ， 说 明 北 部 的 资产 评估 值 与 售 价 比率 最 为 集中 。 


3.6 上 机 题 


视频 文件 ，\video\ 上 机 题 教学 视频 \chap03 wmv 


视频 文件 ，\sample\ 上 机 题 \chap03\... 


3.1 某 劳动 人 事 机 构 统 计 了 某 地 成 年 人 体重 的 抽样 调查 数据 ， 其 中 “性 别 ” 中 “0” 和 
“1” 分 别 表示 “女生 ”和 “男生 ”。 部 分 相关 数据 如 下 表 所 示 。 


观测 编号 性 别 


oluvls wh |- 
-Icoclocl-|i-|o 


99 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


( 续 表 ) 
性 别 


体重 (kg) 
70 
70 
列 
72 
72 
73 
73 
73 


-|~-|ololoco|l-|o -|- 


(1) 试 给 出 体重 的 均值 、 标 准 差 、 四 分 位 点 。 
(2) 统计 并 绘制 频数 分 布 直方 图 。 


3.2 ” 现 有 我 国 31 个 省 、 市 、 自 治 区 的 GDP 的 统计 数据 。 下 表 列 出 了 部 分 数据 。 


省 份 GDP ( 亿 ) 

上 海 5400 
北京 3130 
天 津 1900 
浙江 7400 
江苏 10000 
广东 11000 
福建 4100 
山东 10500 
辽宁 4600 
新 疆 1600 
湖北 5000 
河北 5500 
吉林 2100 
海南 600 
湖南 4200 


试 给 出 GDP 的 平均 值 、 中 位 数 、 标 准 差 、 偏 态 和 峰 度 。 
.3 ”为 分 析 学 生理 科学 习 的 情况 ， 调 查 者 观察 了 两 个 班级 学 生 的 数学 和 物理 成 绩 。 试 先 


a 
对 学 9 


的 成 绩 按照 五 级 制 划分 等 级 并 做 出 等 级 的 交叉 分 析 表 , 分 析 数 学 和 物理 


E 成 绩 之 间 是 否 存 


在 关联 。 
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( 续 表 ) 
班级 数学 物理 性 别 
1 88 90 男 
1 88 87 男 
1 89 92 男 
1 90 87 男 
1 96 97 男 
53 53 男 
并 62 63 男 
多 63 76 男 
2 64 58 男 
66 47 男 
2 男 
2 男 
男 


(1) 试用 SPSS 对 学 生 的 成 绩 按照 五 级 制 划分 等 级 。 

(2) 试 做 出 等 级 的 交叉 分 析 表 分 析 数 学 和 物理 成 绩 之 间 是 否 存在 关联 。 

3.4” 某 地 对 小 学 生 的 身体 发 育 状 况 进行 了 抽样 调查 , 得 到 了 106 名 小 学 生 的 肺活量 数据 。 
部 分 相关 数据 如 下 表 所 示 。 


学 号 肺活量 (mL) 
30130 800 
30087 1100 
30088 1000 
30057 900 
40041 700 
40114 600 
30077 900 
40010 700 
30064 700 
40016 552 
30125 700 
40107 520 
40040 700 
30030 900 
30092 750 


试 采用 探索 性 分 析 方法 ， 分 析 小 学 生 的 肺活量 是 否 呈 正 态 分 布 。 
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在 统计 分 析 的 过 程 中 , 有 时 我 们 会 需要 包含 多 个 统计 量 的 分 析 报 表 , 以 获得 变量 的 相关 信 
息 ， 为 进一步 的 数据 分 析 打 下 基础 。SPSS 的 报告 功能 可 以 按照 一 定 的 要 求 ， 以 列表 的 形式 输 
出 数据 的 相关 统计 量 。 


4.1 在 线 分 析 处 理 报 告 


在 线 分 析 处 理 报告 可 以 对 数据 进行 描述 性 分 析 , 并 给 出 交互 性 表格 以 方便 用 户 自 主 选 择 报 
告 的 内 容 与 形式 。SPSS 的 OLAP〔 联 机 分 析 处 理 ) 立方 过 程 可 以 方便 地 生成 在 线 分 析 处 理 报 
告 ， 下 面 将 对 其 操作 进行 详细 介绍 。 


4.1.1 OLAP 简介 


OLAP (联机 分 析 处 理 ) 立方 过 程 可 以 计算 一 个 或 多 个 分 类 分 组 变量 类 别 中 连续 摘要 变量 
的 总 和 、 均 值 和 其 他 单 变 量 统计 量 。 其 可 以 为 每 个 分 组 变量 的 每 个 类 别 创建 单独 的 层 , 表 中 的 
每 一 个 层 是 依据 一 个 分 组 变量 的 结果 输出 。 


4.1.2 在 SPSS 中 建立 在 线 分 析 处 理 报告 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 sma -< 
后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 建 ru | 
立 在 线 分 析 处 理 报告 。 
1) 在 菜单 栏 中 依次 选择 “分 析 ”| “报告 ”| 一 
“OLAP 立方 体 ” 命 令 ,打开 如 图 4-1 所 示 的 “OLAP ra 
立方 体 ”对 话 框 。 
2) 选择 变量 。 TI 
对 话 框 中 间 有 两 个 空白 列表 框 ， 介 绍 如 下 Gi i 


Q 摘要 变量 。 该 列表 框 中 的 变量 为 需要 进行 
摘要 分 析 的 目标 变量 ， 变 量 要 求 为 数值 型 变量 。 图 4-1 “OLAP 立方 体 ”对 话 框 

@ 分 组 变量 。 该 列表 框 中 的 变量 为 “摘要 变量 ”中 目标 变量 的 分 组 变量 ， 该 变量 的 属性 
可 以 是 字符 型 或 者 取 有 限 值 的 数值 型 变量 。 

我 们 可 以 在 “隐藏 较 小 的 计数 ” 复 选 框 下 ， 设 置 生成 的 表格 中 最 小 的 计数 值 。 若 某 一 个 计 
数 小 于 指定 的 正 整数 〈 如 5) ， 则 该 计数 将 不 显示 于 表格 中 。 

3) 进行 相应 的 设置 。 
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“统计 ”设置 

单 击 “ 统 计 ” 按 钮 ， 弹 出 如 图 4-2 所 示 的 “OLAP 立方 体 : 统计 ”对 话 框 。 

“OLAP 立方 体 : 统计 ”对 话 框 由 “统计 ”和 “单元 格 统计 ”两 个 列表 框 组 成 。 “统计 ” 
列表 框 列 出 了 SPSS 在 线 处 理 分 析 报告 中 可 以 计算 的 统计 量 ， 包 括 中 位 数 、 方 差 、 偏 度 、 峰 度 
等 ; “单元 格 统计 ”列表 框 中 的 统计 量 将 显示 在 最 终 输 出 的 表格 里 。 


“ 差 值 ”设置 
单 击 “ 差 值 ” 按 钮 ， 弹 出 如 图 4-3 所 示 的 “OLAP 立方 体 : 差 值 ”对 话 框 。 
息 oUAp 7 方 体 : 关外 x 
三 摘要 统计 的 差 信 差 值 燃 型 
CE 妈 百分比 壮 值 ) 
Re 口 到 时 之 堵 洋 看 可 莽 术 区 值 d) 
蛤 oLAP 立方 体 : 统计 x 口 组 局 基 值 (G) 
二 之 琴 渤 什 
Lu | 
在 名 个 案 数 中 所 点 的 百分比 | 
对 叫 
[FT 人 
(ae) mn am 
图 4-2 “OLAP 立方 体 : 统计 ”对 话 框 图 4-3 “OLAP 立方 体 : 差 值 ”对 话 框 


该 对 话 框 用 于 设置 差异 统计 方式 ， 主 要 包括 以 下 4 个 选项 组 : 


@ 摘要 统计 的 差 值 。 该 选项 组 包括 “无 ”“ 变 量 之 间 的 差 值 ”和 “组 间 差 值 ”3 个 单 选 按 
钮 , 分别 表 示 不 进行 差异 计算 、 计算 变量 之 间 的 差异 和 计算 分 组 之 间 的 差异 。 若 选择 后 面 两 项 ， 
将 分 别 激活 “变量 之 间 的 差 值 ”和 “个 案 组 间 差 值 ”选项 组 。 

@ 差 值 类 型 。 该 选项 组 包括 “百分比 差 值 ”与 “算术 差 值 ”两 个 复 选 杠 ， 用 于 选择 要 计 
算 的 差异 统计 量 。 

@ 变量 之 间 的 差 值 。 该 选项 组 设置 关于 变量 之 间 差 异 的 选项 ， 需 要 至 少 两 个 汇总 变量 。 
其 中 包括 “变量 ”“ 减 变量 ”两 个 下 拉 列 表 框 和 “百分比 标签 ”"“ 算 术 标 签 ”两 个 文本 框 ， 分 别 
用 于 设置 对 比 的 变量 和 差异 形式 。 同 时 ，SPSS 支持 多 对 变量 比较 ， 设 置 完成 后 单 击 国 按钮 使 
之 选 入 “对 ”列表 框 中 即 可 ， 也 可 单 击 “删除 对 ”按钮 取消 该 变量 对 的 比较 。 

@ 个 案 组 间 差 值 。 该 选项 组 用 于 设置 关于 组 之 间 差异 的 选项 ， 需 要 至 少 一 个 分 组 变量 。 
其 中 包括 一 个 “分 组 变量 ”下 拉 列 表 框 和 “类 别 ”“ 减 类 别 ”“ 百 分 比 标签 ”和 “算术 标签 ” 
4 个 文本 框 ， 分 别 用 于 设置 分 组 变量 、 比 较 的 各 类 别 取 值 和 差异 方式 。 

“标题 ”设置 

单 击 “ 标 题 ”按钮 ， 弹 出 如 图 4-4 所 示 的 “OLAP 立方 :标题 ”对 话 杠 。 
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该 对 话 框 用 于 设置 输出 表格 标题 ， 包 括 “标题 ”和 “文字 说 明 ” 两 个 文本 框 ， 分 别 用 于 输 
入 表格 标题 和 表格 脚注 。 

4) 分 析 结果 输出 。 

设置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 在 线 分 析 处 理 报告 。 

在 线 分 析 处 理 报告 最 大 的 特点 就 是 其 交互 性 操作 , 双击 如 图 4-5 所 示 的 表格 ， 便 可 以 对 表 
格 进行 交互 式 编辑 。 


和 个 案 数 均值 。。 标准 的 百分比 所 的 百分比 
[ree 数学 6297 80 78.71 10.617 100.0% 100.0% 
物理 6386 80 79.83 10.833 100.0% 100.0% 
图 4-4 “OLAP 立方 : 标题 ”对 话 框 图 4-5 “OLAP 立方 体 ” 交 互 式 数据 表 


4.1.3 ”实验 操作 
下 面 以 数据 文件 “4-1” 为 例 ， 来 制作 一 个 在 线 分 析 处 理 报告 。 
1. 实验 数据 描述 


数据 文件 “4-1” 是 两 个 班级 学 生 的 数学 与 物理 成 绩 ， 本 实验 以 该 数据 文件 为 例 ， 绘 制 在 
线 分 析 处 理 报告 (OLAP) ， 原 始 Excel 数据 文件 如 图 4-6 所 示 。 


和 


B EE 加 
委 尝 (分 ) 物 运 (分 ) ”性别 
[ep 


CEJEIENEJEJESSHE 


名 文 
了 2 男 
本 时 
本 廊 
僵 蝎 
71 田 
加 时 
77 太 
古文 
EE 
74 男 
古文 
本 文 
人 i 去 
司 雯 
EE 

廊 


EDE 


图 4-6 数据 文件 “4-1” 原 始 数据 
在 SPSS 的 变量 视图 中 建立 变量 “id”“Math”“PHY” 和 “SEX”， 分 别 表示 学 生 班级 、 
数学 成 绩 、 语 文成 绩 和 性 别 ， 其 中 ， 性 别 变量 中 分 别 用 “0，1” 代 表 “ 女 、 男 ”， 如 图 4-7 所 示 。 
在 SPSS 活动 数据 文件 中 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ， 输 入 完毕 后 部 分 
数据 如 图 4-8 所 示 。 
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Erte sav Er] - BM SPSS Statistics gress - D x 


到 痉 。 到 里， 
和 
LA 和 入 
SV A 
P&L 


[ET 


图 4-7 数据 文件 “4-1” 的 变量 视图 


Em | WM SPS5 Suetics SRE a 


dNarddNsgnre ns 
ssaxsuduysarnpsNsp 


[ Bu SPSS Sabstcs 外 于 入 埃 |Unicooe ON 


图 4-8 数据 文件 “4-1” 的 数据 视图 


2. 实验 操作 步骤 

实验 的 具体 操作 步骤 如 下 : 

人 GE) 在 菜单 栏 中 选择 “分 析 ”|“ 报 告 ” |“OLAP 立方 ”命令 ， 打 开 “OLAP 立方 体 ” 对 
话 框 。 


人 GE562 从 源 交 量 列表 框 中 选择 “数学 ”和 “物理 ”变量 ， 单 击 国 按 钮 将 其 先入 “摘要 变量 ” 
列表 框 中 ， 再 从 源 变 量 列表 框 中 选择 “班级 ”和 和“ 性别” 变量 ， 单 击 国 按钮 将 其 选 
入 “分 组 变量 ”列表 框 中 。 

本 03 单 击 “ 统 计 ” 按 钮 ， 弹 出 “OLAP 立方 体 : 统计 ”对 话 框 ， 将 “个 案 数 ”““ 均 值 ”““ 标 
准 差 "“ 峰 度 ” 和 “ 偏 度 ” 选 入 “单元 格 统计 ”列表 框 中 ， 单 击 “ 继 续 ” 按 钮 。 

单 击 “ 标 题 ” 按 钮 ， 弹 出 “OLAP 立方 体 : 标题 ”对 话 框 ， 在 “标题 ”文本 框 中 输 

入 “学 生成 绩 表 ”， 单 击 “ 继 续 ” 按 钮 。 

单 击 “确定 ”按钮 ， 即 可 输出 在 线 处 理 分 析 报告 。 
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3. 实验 结果 分 析 


图 4-9《〈 左 图 ) 为 案例 处 理 摘要 信息 ， 它 给 出 了 分 析 中 用 到 的 案例 个 数 和 比例 。 我 们 可 以 
看 出 ， 所 有 80 个 案例 都 被 用 于 分 析 。 
图 4-9( 右 图 ) 是 输出 的 OLAP 统计 表 ， 可 以 从 看 出 相关 统计 量 的 取 值 。 此 外 ， 还 可 以 通 
过 双击 表格 进行 OLAP 统计 表 的 交互 操作 。 
个 案 处 理 摘要 学 生成 绩 表 


性 对 总 计 


u 括 8 
四 在 总 和 中 所 占 。 在 总 个 案 数 中 
不 案 数 。 本 分 此 坟 数 分 此 次 yt 和 «mn yi 比 ” 了 上 的 而 分 比 


数学“ 沽 组 人 性别 80 100.0% 0 0.0% a0 1000% 22 5297 80 7871 10517 1000% 1000% 
物理 “ 龟 级 "性 别 80 1000% 0 00% 80 1000% 和 到 5386 80 7983 10833 1000% 1000% 


4-9 在线 处 理 分 析 报 告 输出 结果 


4.2 个 案 摘要 报告 


个 案 摘要 报告 可 以 将 数据 按 用 户 的 指定 要 求 进行 整理 和 报告 ,方便 用 户 的 分 析 过 程 。SPSS 
的 个 案 汇总 过 程 可 以 方便 地 生成 个 案 摘要 报告 ， 下 面 将 对 其 操作 进行 详细 介绍 。 


4.2.1 个案 汇 总 过 程 简介 


SPSS 的 个 案 汇 总 过 程 可 以 为 一 个 或 多 个 分 组 变量 类 别 中 的 变量 计算 子 组 统计 量 并 将 各 级 
别 的 统计 量 进行 列表 以 形成 个 案 摘 要 报告 。 在 个 案 摘要 报告 中 , 每 个 类 别 中 的 数据 值 可 以 列 出 
也 可 以 不 列 出 ， 对 于 大 型 数据 集 ， 可 以 选择 只 列 出 部 分 个 案 。 


4.2.2 在 SPSS 中 生成 个 案 摘 要 报告 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 
建立 个 案 摘要 报告 。 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 报 告 ” | “个案 摘要 ”命令 ， 打 开 如 图 4-10 所 示 的 “个 案 

2) 选择 变量 。 

从 源 变 量 列表 框 中 选择 需要 进行 摘要 分 析 的 目标 变量 , 单 击 加 按钮 将 选中 的 变量 先入“ 变 
量 ” 列 表 框 中 ; 再 选择 分 组 变量 ， 将 其 选 入 “分 组 变量 ”列表 框 中 ， 如 图 4-11 所 示 。 

3) 进行 相应 的 设置 。 

“统计 ”设置 

单 击 “ 统 计 ” 按 钮 ， 弹 出 如 图 4-12 所 示 的 “摘要 报告 : 统计” 对话 框 。 

“摘要 报告 : 统计 ”对 话 框 与 “OLAP 立方 体 : 统计 ”对 话 框 中 所 含 统计 量 和 设置 方式 基 
本 相同 ， 在 此 不 再 资 述 。 

“选项 ”设置 

单 击 “ 选 项 ”按钮 ， 弹 出 如 图 4-13 所 示 的 “选项 ”对 话 框 。 
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前 个 = 和 x 全 人 短 
EL | 闯 量 久 : mm rr | 
二 总 sa 
zm | 国 国 
分 站 实 旺 (GS): 2 
性 别 [SEX] 
国 国 [2m 
国 罪 示 个 案 (L) | 属 村 示 个 来 (L) 
国 将 个 率 限 制 为 前 E)|100 | 将 个 来 限制 为 前 (|100 
网 仅 时 示 有 妆 个 罕 册 ) 属 仅 时 示 有 站 个 这 (H) 
昕 1 案 3C) | aii 
Gj » aE ey | [ED 
图 4-10 “个 案 摘要 ”对 话 框 4-11 “个 案 摘要 ”的 变量 选择 
办 选 页 x 
标题 中 : 
文字 说 明 (Q): 
图 总 计 副 标题 (S) 
电 成 列 排除 具有 坝 失 值 的 个 案 Q) 
扶 失 统计 显示 方式 dj: |[  ] 
[esGj | 
图 4-12 “摘要 报告 :统计 ”对 话 框 图 4-13 “选项 ”对 话 框 


该 对 话 框 中 的 “标题 ”和 “文字 说 明 ” 文 本 框 ， 分 别 用 于 输入 表格 标题 和 表格 脚注 。 

选中 “总 计 副 标题 ” 复 选 框 ， 表 示 把 统计 量 的 名 称 作为 子 标题 显示 在 单元 格 内 ， 选中 “成 
列 排除 具有 缺失 值 的 个 案 ” 复 选 框 ， 表 示 只 要 分 析 中 有 一 个 变量 取 值 缺失 ， 就 把 这 条 记录 从 分 
析 中 删除 ， “缺失 统计 显示 方式 ”文本 框 用 于 设置 代表 缺失 值 的 符号 。 

4) 分 析 结 果 输 出 。 


设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 个 案 摘 要 报告 。 
下 面 同样 以 数据 文件 “4-1” 为 例 ， 讲 解 个 案 摘要 报告 的 制作 。 
1. 实验 数据 描述 


数据 文件 “4-1” 是 两 个 班级 学 生 的 数学 与 物理 成 绩 。 本 实验 以 该 数据 文件 为 例 ， 绘 制 个 
案 摘要 报告 。 


变量 的 建立 和 数据 的 输入 与 4.1.3 节 相 同 ， 在 此 不 再 袭 述 。 
2. 实验 操作 步骤 
实验 的 具体 操作 步骤 如 下 : 
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GES6i) 在 菜单 栏 中 选择 “分 析 ”|“ 报 告 ” |“ 个 案 摘 要 ”命令 ， 弹 出 “个 案 摘要 ”对 话 框 。 

人 ES562 从 源 变量 列表 框 中 选择 “数学 ”和 “物理 ”变量 ， 单 击 园 按 钮 选 入 “变量 ”列表 杠 

中 ， 再 选择 “班级 ”和 “性 别 ” 变 量 ， 选 入 “分 组 变量 ”列表 框 中 。 

GES63 单 击 “ 统 计 ” 按 钮 ， 弹 出 “摘要 报告 : 统计 ”对 话 框 ， 将 “个 案 数 ”“ 均 值 ”“ 标 准 
差 ”“ 峰 度 ” 和 “ 偏 度 ” 选 入 “单元 格 统计 ”列表 框 中 ， 单 击 “ 继 续 ” 按 钮 。 

GE563 单 击 “ 选 项 ”按钮 ， 弹 出 “选项 ”对 话 框 ， 在 “标题 ”文本 框 中 输入 “学 生成 绩 表 
个 案 汇总 表 ”， 单 击 “ 继 续 ” 按 钮 。 

GE565 单 击 “ 确 定 ” 按 钮 ， 输 出 个 案 汇总 表 。 

3. 实验 结果 分 析 


同样 ， 图 4-14( 左 图 ) 为 案例 处 理 摘要 信息 ， 学 于 岂 本 表 个 过 江 入 和 
它 给 出 了 分 析 中 用 到 的 案例 个 数 和 比例 ， 我 们 可 以 aa 证 
看 出 ， 所 有 80 个 案例 都 用 了 分 析 。 : Te 
图 4-14 右 图 ) 输出 的 个 案 摘要 报告 统计 表 ， 4 二 
由 于 本 书 篇 幅 所 限 ， 只 取 一 班 女生 部 分 进行 分 析 ， 而 四 
我 们 可 以 从 中 看 出 所 有 符合 分 类 条 件 的 变量 和 相关 9 四 
统计 量 的 取 值 及 分 组 情况 。 本 呈 
CT 有 | TT 
物理 * 班 级 * 性别 80 100.0% 80 100.0% 女 度 887 722 
3a. 限于 前 100 个 个 案 ， 偏 度 -~.813 273 


图 4-14 个 案 摘 要 报告 输出 结果 


4.3 行 形式 摘要 报告 
与 个 案 摘要 报告 相 比 , 行 形式 的 摘要 报告 可 以 生成 更 复杂 的 报告 形式 下面 就 来 介绍 SPSS 
的 行 形式 摘要 报告 过 程 。 
4.3.1 “ 行 形式 摘要 报告 简介 


行 形式 的 摘要 分 析 报 告 可 以 将 数据 重新 组 织 ， 并 按 用 户 的 要 求 列表 在 “输出 查看 器 窗口 ” 
输出 。 此 外 ， 行 形式 的 摘要 报告 还 可 以 进行 相关 的 统计 分 析 并 给 出 相应 的 统计 量 。 


4.3.2 ” 行 形式 摘要 报告 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 
建立 行 形式 摘要 报告 。 
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1) 在 菜单 栏 中 选择 “分 析 ”| “报告 ”|“ 按 行 报告 摘要 ”命令 ,打开 如 图 4-15 所 示 的 “ 报 
告 : 行 摘要 ”对 话 框 。 

2) 选择 变量 。 

从 源 变量 列表 框 中 选择 需要 摘要 分 析 的 目标 变量 , 单 击 国 按 钮 先入 “数据 列 变量 ”列表 框 
中 ; 从 源 变 量 列表 框 中 选择 分 组 变量 ， 单 击 国 按 钮 选 入 “分 界 列 变量 ”列表 框 中 ， 如 图 4-16 
所 示 。 


茹 据 列 /D) 


本 
分 界 列 (B) 
分 轩 J 区 量 @): 
国 
| 
om | 
DB 人 RE) | 
OD) | eM 
[LE ] me 加 ElEaa 
图 4-15 “报告 : 行 摘要 ”对 话 框 图 4-16 “报告 : 行 摘要 ”的 变量 选择 
3) 对 指定 变量 的 参数 进行 设置 。 瞧 报告 : PHY 的 数据 列 杞 式 X 


对 于 被 选 入 “数据 列 变量 ”列表 框 中 的 变量 ， 
可 以 单 击 “ 格 式 ” 按 钮 打开 对 话 框 来 设置 变量 的 显 
示 格 式 ， 如 图 4-17 所 示 。 

在 “报告 PHY 的 数据 列 格式 ”对 话 框 中 ， 可 Ex 并 U: ED ed) 


列 标题 四: 


以 输入 并 调整 列 标题 ， 调 整 列 中 位 数 的 位 置 和 列 的 本 lw: [ |] 
回 相 x 于 右 介 的 偏 黎 里 (0) | jm 容 

内 容 及 列 宽 。 MQ: po |||@fv 

而 对 于 被 选 入 “分 界 列 变量 ”列表 框 中 的 变量 ， 曲 在 列 中 居中 (C) 口 什 标签 (8) 
除了 可 以 设置 其 格式 外 ， 还 可 以 设置 统计 量 、 排 列 Erol 
顺序 和 页 面 参数 。 

«摘要 ”设置 图 4-17 告 : PHY 的 数据 列 格式 ”对 话 框 

单 击 “ 分 组 列 变量 ”列表 框 下 的 “摘要 ”按钮 ,弹出 如 图 4-18 所 示 的 “报告 : SEX 的 摘要 行 ” 
对 话 框 。 


可 选 的 统计 量 包 括 值 的 总 和 、 值 的 平均 值 、 最 大 值 、 最 小 值 、 标 准 差 、 峰 度 、 方 差 、 偏 度 、 
个 案 数 、 上 方 百分比 、 下 方 百分比 和 区 间 内 百分比 (临界 值 在 后 面 的 文本 框 中 输入 〉》。 

“选项 ”设置 

单 击 “ 选 项 ”按钮 ， 弹 出 如 图 4-19 所 示 的 “报告 : SEX 的 分 界 选 项 ”对 话 框 。 

“报告 : SEX 的 分 界 选项 ”对 话 框 中 包括 “页 面 控制 ”选项 组 与 “摘要 前 的 空 行 数 ” 文 
本 框 。“ 页 面 控 制 ” 选 项 组 用 于 设置 分 组 类 别 输出 的 页 面 参 数 ， 有 3 种 选择 : “分 界 前 跳 过 的 
行 数 ”“ 开 始 下 一 页 ”和 “开始 新 页 并 重 置 页 码 ”。 
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蛤 报告 : SEX 的 其 要 行 x 息 报告 : SEX 的 分 界 选项 x 
ft E 站 标准 莽 (R) 
Ee en 
可 仿 度 on) 名 开始 下 一 页 (B) 
侣 开始 新 页 并 重 置 页 码 (N) 
加 下 方 百分比 (C) 从 多 
回 区 同 内 百分比 E) T 风 上 HR 简要 前 的 空 行 数 (5D): | 0| 
CHE NE [Esc ma am | 
图 4-18 “报告 SEX 的 摘要 行 ” 对 话 框 图 4-19 “报告 ， SEX 的 分 界 选项 ”对 话 框 
数据 已 排序 
如 果 使 用 分 组 变量 分 析 前 , 数据 已 经 按 分 组 变量 值 进行 排序 , 则 可 选中 该 复 选 框 以 节省 运 

行 时 间 。 

4) 全 部 数据 的 参数 设置 。 : 选项 区 
“摘要 ”设置 er 
单 击 “ 摘 要 ”按钮 ， 弹 出 的 界面 与 分 界 列 下 相同 ， 参 数 选 铀 失 值 显示 方式 00: |[ ] 

项 和 设置 方法 也 一 致 ， 在 此 不 再 资 述 。 Ba: hi |] 
“选项 ”设置 EHETIETY 
单 击 “ 选 项 ”按钮 ， 弹 出 如 图 4-20 所 示 的 “报告 : 选项 ” _ 

对 话 框 。 图 4-20 “报告 : 选项 ”对 话 框 


“报告 : 选项 ”对 话 框 中 包括 “成 列 排除 具有 缺失 值 的 个 案 ” 复 选 框 以 及 “缺失 值 显 示 方 
式 ” 和 “起 始 页 码 ” 两 个 文本 框 。 选 中 “成 列 排除 具有 缺失 值 的 个 案 ” 复 选 框 ， 表示 只 要 分 析 
中 有 一 个 变量 取 值 缺失 ， 就 把 这 条 记录 从 分 析 中 删除 ; “缺失 值 显示 方式 ”文本 框 用 于 设置 代 
表 缺 失 值 的 符号 ;， “起 始 页 码 ” 文 本 框 用 于 指定 输出 结果 的 起 始 页 码 。 


“布局 ”设置 | 外 3E: 5 x 

单 击 “ 布 局 ”按钮 ,弹出 如 图 4-21 所 示 的 “报告 :mwa = 
布局 ”对 话 框 。 pet 

该 对 话 框 主要 用 于 设置 输出 结果 的 格式 ， 包 括 以 mana#a， 攻 下 
下 5 个 选项 组 : st 人 到 

本 是 教 四 [了 || 加 所 有 分界 部 在 第 一 列 4) 

Q@ “页 面 布局 ”选项 组 。 该 选项 组 用 于 设置 每 页 jswwiwysmD: [1 | | S39 2 

的 行 数 和 每 行 的 列 数 及 对 齐 方式 ， 设 置 时 只 需要 在 相 | rt 


应 的 文本 框 或 下 拉 列表 框 中 进行 输入 或 选择 即 可 。 。 esrssx [| oa 
@ “页 面 标题 和 页 脚 ”选项 组 。 该 选项 组 用 于 设 “=” Rs 


置 标题 后 面 和 页 脚 前 面 的 行 ， 设 置 时 只 需要 在 相应 的 一 
文本 框 中 进行 输入 。 (an and ns 

加 “ 列 标题 ” 选项 组 。 该 选项 组 用 于 设置 列 标题 。 。 图 421 “报告 : 布局 ” 对话 杠 
的 相关 参数 。 


由 “分 界 列 ”选项 组 。 该 选择 组 用 于 设置 分 组 变量 的 输出 位 置 ， 选 中 “所 有 分 界 都 在 第 
一 列 ” 复 选 框 ， 表 示 所 有 分 组 变量 都 在 第 一 列 给 出 ; “每 次 分 界 时 的 缩 进 ”文本 框 用 于 设置 每 
一 级 分 组 向 右 缩 进 的 字数 。 
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@ “数据 列 行 与 分 界 标签 ”选项 组 。 该 选项 组 用 于 
设置 数据 列 与 分 组 标注 的 对 齐 方 式 , 共有 ”自动 垂直 对 齐 ” 


“显示 在 同一 行 ”和 “显示 在 标签 下 方 ”3 种 方式 可 供 选 “| |2 吕 2 
择 。 

“标题 ”设置 

单 击 “ 标 题 ”按钮 ， 弹 出 如 图 4-22 所 示 的 “报告 : 
标题 ”对 话 杠 。 

该 对 话 框 包括 变量 列表 框 及 “页 面 标题 ”与 “页 面 脚 
注 ” 两 个 选项 组 。 

桂 天 丈量 (S): 


Q@ “页 面 标题 ”选项 组 。 在 “ 左 ” “中心 ”“ 右 ” 
文本 框 中 可 以 分 别 输入 显示 内 容 , 最 多 可 以 指定 十 页 的 标 
题 ， 各 页 的 设置 通过 “上 一 页 ”和 “下 一 页 ”按钮 调节 。 

@ “页 面 脚注 ”选项 组 。 该 选项 组 用 于 设置 页 脚 ，。 图 422 
设置 方法 同 “页 面 标题 ”选项 组 。 


x 


有 
日 
加 


i 


五 (ER 
面 )PAGE 


让 国 国 国 
已 


往 (第 11 行 ) 


有 


国 国 国 
人 
日 


“报告 :标题 ”对 话 框 


@@ “特殊 变量 ”列表 框 中 给 出 了 两 个 系统 变量 :“DATE” 和 “PAGE”， 选 中 它们 后 单 击 


国 按钮 即 可 将 其 选 入 相应 的 显示 位 置 。 


显示 个 案 
选中 该 复 选 框 ， 表 示 在 结果 中 显示 所 有 的 单个 记录 行 。 


预览 


选中 该 复 选 框 后 ，SPSS 将 只 输出 第 一 页 的 显示 结果 作为 预览 ， 如 果 用 户 满意 输出 格式 ， 


只 需 取消 该 复 选 框 便 可 输出 全 部 的 显示 结果 。 
5) 分 析 结 果 输 出 。 


设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 行 形式 摘要 报告 。 


4.3.3 ”实验 操作 
下 面 同样 以 数据 文件 “4-1” 为 例 ， 讲 解 行 形式 摘要 报告 的 制作 。 
1. 实验 数据 描述 


数据 文件 “4-1” 是 两 个 班级 学 生 的 数学 与 物理 成 绩 。 本 实验 以 该 数据 文件 为 例 ， 绘 制 行 


形式 摘要 报告 。 
变量 的 建立 和 数据 的 输入 与 4.1.3 节 相 同 ， 在 此 不 再 效 述 。 


2. 实验 操作 步骤 
实验 的 具体 操作 步骤 如 下 : 


EEEDY 在 菜单 栏 中 选择 “分 析 ”| “报告 ”| “ 按 行 报告 摘要 ”命令 ， 打 开 “ 报 告 : 行 摘要 ” 


人 GE562 从 源 变量 列表 框 中 选择 “数学 ”和 “物理 ”变量 ， 单 击 转 按 钮 将 其 先入 “数据 列 变 
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量 ” 列 表 框 中 ; 再 从 源 变 量 列表 框 中 选择 “性 别 ” 
变量 ， 单 击 国 按钮 将 其 选 入 “分 界 列 变量 ”列表 
框 中 。 
GE563 单 击 “ 分 界 列 ” 下 方 选项 组 中 的 “摘要 ”按钮 ， 
弹出 “报告 ， SEX 的 摘要 行 ”对 话 框 ， 选 中 “个 
案 数 ”“ 值 的 平均 值 ”"“ 标 准 差 "“ 峰 度 ” 和 “ 偏 度 ” 
复 选 框 ， 单 击 “ 继 续 ” 按 钮 。 
人 GE365 单 击 对 话 框 右 侧 的 “摘要 ”按钮 ， 弹 出 “报告 : 
最 终 摘要 行 ” 对 话 框 , 选中 “ 值 的 平均 值 ” 和 “ 标 
准 差 ” 复 选 框 ， 单 击 “ 继 续 ” 按 钮 。 
GE5365 单 击 “确定 ”按钮 ， 即 可 输出 行 形式 摘要 报告 ， 
如 图 4-23 所 示 。 4-23 ” 行 形式 摘要 报告 输出 信息 
通过 行 形式 的 摘要 报告 , 我 们 可 以 看 出 SPSS 对 数学 和 英语 成 绩 按 性 别 进行 了 汇总 。 此 外 ， 
我 们 还 可 以 得 到 相关 统计 量 的 取 值 。 


4.4 列 形式 摘要 报告 
与 行 形式 摘要 报告 对 应 的 还 有 列 形式 摘要 报告 ， 下 面 对 其 操作 进行 详细 介绍 。 


4.4.1 列 形 式 摘 要 报告 简介 


列 形 式 摘要 报告 与 行 形式 摘要 报告 功能 基本 相同 ， 只 是 在 输出 格式 上 略 有 差异 。 


4.4.2 ” 列 形式 摘要 报告 的 SPSS 操作 


列 形式 摘要 报告 的 生成 操作 与 行 形式 摘要 报告 类 似 ， 本 节 重 点 介绍 其 独特 的 特点 。 


1) 在 菜单 栏 中 依次 选择 “分 析 ”|“ 报 告 ”|“ 按 列 报告 摘要 ”命令 ， 弹 出 如 图 4-24 所 示 
的 “报告 : 列 摘要 ”对 话 框 。 

2) 选择 变量 。 

从 源 变量 列表 框 中 选中 需要 摘要 分 析 的 目标 变量 ， 选 入 “数据 列 变量 ”列表 框 中 ; 再 选择 
分 组 变量 ， 选 入 “分 界 列 变量 ”列表 框 中 。 

3) 对 汇总 变量 的 参数 进行 设置 。 

对 选 入 “数据 列 变量 ”列表 框 中 的 变量 ， 可 以 设置 输出 统计 量 和 输出 格式 。 

“摘要 ”设置 

选中 相关 的 变量 ， 单 击 “ 摘 要 ”按钮 ， 弹 出 如 图 4-25 所 示 的 “报告 : PHY 的 摘要 行 ” 对 
话 框 。 

“报告 : PHY 的 摘要 行 ”对 话 框 可 以 为 每 个 汇总 变量 分 别 设置 输出 的 统计 量 ， 这 里 可 以 
输出 的 统计 量 与 行 形式 摘要 报告 中 相同 ， 只 不 过 为 单 选项 。 


第 4 章 基本 统计 分 析 报表 的 制作 


和 具 报告 : PHY 的 摘要 行 
Fi | a 
Se 上 回 值 的 总 和 | 吕 标准 差 ) 
国 占 值 的 平均 值 Q) 〇 方差 
日 最 小 值 W) 。。 曲 上 度 (9 
名 最 大 值 % 加 仿 度 QW) 
Fr 
日 个 半数 G) 
NO (UU): 
UU 
国 Pe 日 上 方 百分比 PP) 加 下 方 百分比 (C) 
[a EE 下 限 (L): 上 限 d): 
国 升 谋反 - cp 
| ee 曲 区 间 内 百分比 E) 
1 的 已 排序 G) 
[ED ae 基本 天 四 攻 加 [esGj ai | 
图 4-24 “报告 : 列 摘要 ”对 话 框 图 4-25 “报告 PHY 的 摘要 行 ”对 话 框 
插入 总 计 


单 击 该 按钮 ，SPSS 会 将 一 个 名 为 “总 计 ” 的 变量 加 入 “数据 列 变量 ”列表 框 ， 在 结果 中 
以 列 的 形式 对 其 他 列 的 数据 进行 汇总 。 

4) “分 界 列 ”选项 组 中 包括 “选项 ”和 “格式 ”按钮 、“ 排 列 顺序 ”及 “数据 已 排序 ” 
复 选 枉 。 对 分 类 变量 的 参数 设置 与 行 形式 摘要 报告 一 致 ， 在 此 不 再 袭 述 。 


5) 对 全 部 变量 的 参数 设置。 人 
“选项 ”设置 号 计 
单 击 “ 先 项 ”按钮 ， 弹 出 如 图 4-26 所 示 的 “报告 选 | 生 本 
项 ”对 话 框 。 a 
选中 “显示 总 计 ” 复 选 框 ， 表 示 在 输出 结果 的 最 后 增加 wna waaao: [一 
对 所 有 行进 行 汇总 的 新 行 , “标签 ”文本 框 用 于 指定 这 个 汇 区 加 区 丰 [ 区 加 
总 行 的 行 标签 。 其 他 选项 的 设置 与 行 形式 摘要 报告 中 相同 。 
6) 分 析 结果 输出 。 图 4-26 “报告 选项 ”对 话 框 


设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 列 形 式 摘要 报告 。 


下 面 同 样 以 数据 文件 “4-1” 为 例 ， 讲 解 列 形式 摘要 报告 的 制作 。 

1. 实验 数据 描述 

数据 文件 “4-1” 内 容 包括 变量 的 建立 和 数据 输入 都 已 在 4.1.3 节 介 绍 ， 在 此 不 再 装 述 。 
2. 实验 操作 步骤 


实验 的 具体 操作 步骤 如 下 : 
GE) 在 菜单 栏 中 选择 “分 析 ”|“ 报 告 ” |“ 按 列 报告 摘要 ”命令 ， 打 开 “ 报 告 : 列 摘要 ” 


人 ES62 从 源 变量 列表 框 中 选择 “数学 ”和 “物理 ”变量 ， 单 击 国 按 钮 将 其 选 入 “数据 列 变量 ” 
列表 框 中 ， 再 选择 “性 别 ”变量 ， 单 击 国 | 按 钮 将 其 先入“ 分界 列 变量 ”列表 框 中 。 


dd 
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GE563 选中 “数学 ”变量 ， 单 击 下 面 的 “摘要 ”按钮 ， 在 “报告 : Math 的 摘要 行 ”对话 框 
中 选中 “标准 差 ” 单 选 按钮 ， 选 中 “物理 ”变量 ， 单 击 “ 摘 要 ”按钮 ， 在 “报告 : 
PHY 的 摘要 行 ” 对 话 框 中 选中 “ 值 的 平均 值 ” 
单 选 按钮 ， 单 击 “ 继 续 ” 按 钮 。 
单 击 “ 选 项 ”按钮 打开“ 报告 : 选项 ”对 话 
框 ， 选 中 “显示 总 计 ” 复 选 框 ， 在 “标签 ” 文 
本 框 中 输入 “汇总 ”， 单 击 “ 继 续 ” 按 钮 。 
GE5365 单 击 “ 确 定 ”按钮 ， 即 可 输出 列 形式 摘要 报告 ， 
如 图 4-27 所 示 。 


图 4-27 中 给 出 了 数学 与 物理 成 绩 的 不 同 组 的 均值 ， 以 
及 汇总 数据 。 图 4-27 列 形式 摘要 报告 的 输出 结果 


(ssp 


45 上 机 题 


视频 文件 ，\ideo\ 上 机 题 教学 视频 \chap04.wmv 
| 本 | 视频 文件 ，\sample\ 上 机 题 \chap04\.… 


4.1 数据 文件 给 出 了 两 个 地 区 不 同 销售 小 组 销售 电视 和 空调 的 相关 统计 数据 ， 两 个 地 区 
的 地 区 名 称 用 数字 “1” 和 “2” 代 替 ， 部 分 数据 如 下 表 所 示 〈 数 据 路 径 : 视频 文件 sample\ 上 
机 题 \chap04\ 习 题 \ 第 4 章 第 一 题 .sav) 。 


地 区 


销售 组 
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( 续 表 ) 
地 区 电视 ( 台 ) 空调 ( 台 ) 销售 组 
! 87 88 3 
1 | ss 90 | 3 
| ss 87 3 
1 [89 92 [3 
1 | 9 87 [3 
1 [96 97 [3 
2 53 53 i 


(1) 试 根据 上 表 中 的 数据 ， 制 作 在 线 处 理 分 析 报 告 (OLAP) 。 
(2) 试 根据 上 表 中 的 数据 ， 制 作 个 案 摘 要 报告 。 


4.2 某 农 业 大 学 对 3 种 化 肥 的 缓 释 施肥 效果 进行 试验 ， 样 本 作物 采用 双 季 稳 ， 我 们 观测 
了 产量 和 施肥 类 型 两 个 变量 , 部 分 数据 如 下 表 所 示 ( 数 据 路 径 : 视频 文件 sample\ 上 机 题 \chap04\ 
习题 \ 第 4 章 第 二 题 .sav) 。 


试验 田 第 一 季 产 量 〈 吨 ) 第 二 季 产 量 ( 吨 ) 化 肥 
1 197 100 1 
1 207 90 1 
1 210 75 1 
1 213 99 1 
1 219 93 1 
1 232 111 1 
1 235 103 1 
1 248 108 1 
1 251 115 2 
1 258 120 2 
1 258 108 2 
1 261 118 2 
和 267 1 2 
267 120 2 
1 267 108 
1 270 124 2 
1 277 122 3 
1 280 125 3 
1 280 121 3 
1 283 128 3 
286 121 3 


(1) 试 根据 上 表 中 的 数据 ， 制 作 行 形式 的 摘要 报告 。 
(2) 试 根据 上 表 中 的 数据 ， 制 作 列 形式 的 摘要 报告 。 
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在 统计 分 析 中 , 经 常 遇 到 这 样 的 问题 : 要 对 抽取 的 样本 按照 某 个 类 别 分 别 计算 相应 的 统计 
量 ， 如 平均 数 、 标 准 差 等 ; 或 者 检验 两 个 相关 的 样本 是 否 来 自 具有 相同 均值 的 总 体 ; 或 者 检验 
两 个 有 联系 的 正 态 总 体 的 均值 是 否 有 显著 差异 等 。 本 章 介绍 的 均值 比较 过 程 及 T 检验 过 程 可 
以 解决 此 类 统计 分 析 问 题 。 

如 果 样 本 数据 只 有 一 组 ， 通 常用 到 均值 比较 过 程 和 单 样本 T 检验 ， 如 果 样 本 数据 有 两 组 
且 两 组 样本 是 随机 独立 的 ， 则 通常 用 到 独立 样本 T 检验 ; 如 果 样 本 数据 有 两 组 且 两 组 样本 不 
是 随机 独立 的 ， 则 通常 用 到 成 对 样本 T 检验 ; 如果 样 本 数据 有 两 组 以 上 ， 则 需要 用 到 方差 分 
析 的 方法 。 


5.1 均值 过 程 


均值 过 程 计算 一 个 或 多 个 自 变 量 类 别 中 因 变 量 的 分 组 均值 和 相关 的 单 变量 统计 。 本 节 将 对 
SPSS 中 的 均值 过 程 及 相关 操作 进行 讲解 。 


5.1.1 “均值 过 程 的 简介 


与 第 4 章 中 描述 性 统计 分 析 相 比 , 若 仅仅 计算 单一 组 别 的 均 数 和 标准 差 , 均值 过 程 并 无 特 
别 之 处 。 但 若 用 户 要 求 按 指 定 条 件 分 组 计算 均 数 和 标准 差 , 如 分 班级 同时 分 性 别 计算 各 组 的 均 
数 和 标准 差 等 ， 则 用 均值 过 程 更 显 简单 快捷 。 另 外 ,均值 过 程 中 可 以 执行 单 因 素 方差 分 析 , 查 
看 均值 是 否 不 同 。 


5.1.2 ”均值 过 程 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文 “ 面 和 一 一 一 一 一 一 一 一 一 一 
件 后 ， 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 _ ES 
进行 均值 比较 分 析 。 凶 
1) 在 菜单 栏 中 选择 “分 析 ”|“ 比 较 平均 值 ” ds 
|“ 平 均值 ”命令 ， 打 开 如 图 5-1 所 示 的 “平均 a 
值 ” 对 话 框 。 
2) 选择 变量 。 
将 变量 分 别 选 入 “ 因 变 量 列表 ” 和 “ 自 变 量 ， Cap 全 辣 基 大 八国 
列表 ”两 个 列表 框 中 。 图 5-1 “平均 值 ”对话 杠 


。 因 变 量 列表 : 该 列表 框 中 的 变量 为 要 进行 均值 比较 的 目标 变量 ， 又 称 为 因 变量 ， 且 因 变 量 
一 般 为 度量 变量 。 如 要 比较 两 个 班 的 数学 成 绩 的 均值 是 否 一 致 ， 则 数学 成 绩 变量 就 是 因 变 
量 ， 班 级 就 是 自 变 量 。 
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。 自 变 量 列表 : 该 列表 框 中 的 变量 为 分 组 变量 ， 又 称 为 自 变 量 。 自 变量 为 分 类 变量 ， 其 取 值 
可 以 为 数字 ， 也 可 以 为 字符 串 。 一 旦 指定 了 一 个 自 变量 ，“ 下 一 个 ”按钮 就 会 被 激活 (如 
图 5-2 所 示 ) ， 此 时 单 击 该 按钮 可 以 在 原 分 层 基础 上 进一步 再 细 分 层次 ， 也 可 以 利用 “上 
一 个 ” 回 到 上 一 个 层次 。 如 果 在 层 1 中 有 一 个 自 变量 ， 层 2 中 也 有 一 个 自 变量 ， 结 果 就 
显示 为 一 个 交叉 的 表 ， 而 不 是 对 每 个 自 变量 显示 一 个 独立 的 表 。 

3) 进行 相应 的 设置 。 

“选项 ”设置 

单 击 对 话 框 右 侧 的 “选项 ”按钮 ， 弹出 如 图 5-3 

所 示 的 “平均 值 : 选项 ”对 话 框 。 


晤 9 估 x 


因 诡 量 列表 虽 ): 
帮工 人 最 蛤 (年 ) 江 因 EE 


时 111 一 一 一 一 一 一 一 一 


Eg ED 


EI JIC EE 
图 5-2 “平均 值 ” 对 话 框 图 5-3 “平均 值 : 选项 ”对 话 框 
“平均 值 : 选项 ”对 话 框 主要 用 于 设置 输出 统计 量 。 
中 “统计 ”列表 框 。 该 列表 框 用 于 存放 可 供 输出 的 常用 统计 量 ， 主 要 包括 “中 位 数 ”“ 分 
组 中 位 数 ”“ 平 均值 标准 误差 ”“ 总 和 ”“ 最 小 值 ” “最 大 值 ” “范围 ”“ 第 一 个 ” “最 后 一 
个 ”“ 方 差 ”“ 峰 度 ”“ 偏 度 ” 等 ， 这 些 统计 量 在 “描述 性 分 析 ” 中 均 有 介绍 。 
@ “单元 格 统计 ”列表 框 。 该 列表 框 用 于 存放 用 户 指 定 要 输出 的 统计 量 ， 主 要 来 源 于 左 
侧 的 统计 量 列 表 框 。 其 中 ， 系 统 默认 输出 的 是 “平均 值 ”“ 个 案 数 ”“ 标 准 差 ” 用 户 可 以 选择 
需要 输出 的 统计 量 ， 然 后 单 击 中 间 的 国 按钮 使 之 选 入 “单元 格 统计 ”列表 框 。 
图 “第 一 层 的 统计 ”选项 组 。 该 选项 组 用 于 检验 第 一 层 自 变量 对 因 变 量 的 影响 是 否 显著 ， 
包括 两 个 复 选 框 : 


。 Anova 表 和 Eta， 表 示 对 第 一 层 自 变量 和 因 变 量 进行 单 因素 方差 分 析 ， 然 后 输出 Anova 表 
和 Eta 的 值 ; 

。 线性 相关 度 检验 ， 表 示 对 各 组 平均 数 进行 线性 趋势 检验 ， 实 际 上 是 对 因 变 量 的 平均 值 对 自 
变量 进行 线性 回归 ， 并 计算 该 回归 的 判决 系数 和 相关 系数 ， 该 检验 仅 在 自 变量 有 3 个 以 上 
层次 时 才能 进行 。 

设置 完毕 后 ， 单 击 “ 继 续 ” 按 钮 ， 可 以 返回 到 “平均 值 ”对 话 框 。 

4) 分 析 结果 输出 。 

单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 平均 值 过 程 的 结果 。 


yg 
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5.1.3 ”实验 操作 
下 面 将 以 “5-1” 数 据 文件 为 例 ， 讲 解 平均 值 过 程 的 具体 操作 并 对 结果 进行 说 明 。 
1. 实验 数据 描述 


“5-1” 数 据 文件 展示 的 是 某 公 司 600 名 技术 和 管理 岗位 员工 的 工作 经 验 和 工资 情况 ， 下 
面 将 利用 平均 值 过 程 来 分 析 不 同 的 工作 经 验 是 否 导 致 薪水 的 不 同 ， 原 始 Excel 数据 文件 如 图 
5-4 所 示 。 


的 《 年 ) 靳 水 《元 /小 时 7 
13.74 


| 护林 岗位 1 一 5 
| 5 管理 网 位 11 一 15 
了 管理 岗 性 1 一 5 


5-4 “5-1” 数 据 文件 原始 数据 
在 SPSS 变量 视图 中 建立 变量 “岗位 ”“ 工 作 经 验 ” 和 “薪水 ”， 分 别 表示 员工 岗位 、 工 
作 经 验 和 每 小 时 薪水 。 在 “ 值 ”中 对 变量 取 值 进行 设置 “岗位 ”变量 将 “管理 岗位 ”和 “ 技 
术 岗 位 ”分 别 赋值 为 “1” 和 “0”; “工作 经 验 ” 变 量 将 工作 经 验 在 1~5、6~10、11~15、16~20、 


ER 

| 了 .管理 册 习 无 8 。 性 右 仿 标 任 输入 
| 工作 全 冯 和 字 工作 经 六 (年) 人 .小 于 等 于 无 ”日 性 右 ”4 标 度 输入 
3 四 水 。 无 无 8 要 右 信 导 人 办 入 


[二 spSS Stabshics 外 于 加法 省 ”Unicode ON 


图 5-5 “5-1” 数 据 文件 的 变量 视图 
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在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 搜集 的 数据 输入 到 各 个 变量 中 ,输入 完毕 后 部 分 
数据 如 图 5-6 所 示 。 


夫 9 sa [MR] -BM SPs5 Statistics: ed 7 
文件 四 坟 和 中 二 看 WD 亲 轨 美术 中 分析 届 南山。 PNG 区 二 UW 扩 村 0 证 Da。 大 it) 


a 
I 作坊 镶 | 沪 玫 水 | 里 | | 安 a | a ET 


74 


ET 


图 5-6 “5-1” 数 据 文件 的 数据 视图 


2. 实验 操作 步骤 


具体 操作 步骤 如 下 : 

GES6i) 打开 “5-1” 数据 文件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 析 ” 
| “比较 平均 值 ”|“ 平 均值 ”命令 ， 在 弹出 的 “平均 值 ”对 话 框 中 ， 将 “每 小 时 薪水 ” 
选 入 “ 因 变 量 列表 ”列表 框 中 ， 将 “工作 经 验 ” 选 入 “ 自 变 量 列表 ”列表 框 中 。 

人 ES53627 单 击 “选项 ”按钮 ， 弹 出 “平均 值 : 选项 ”对 话 框 ， 将 “平均 值 ”““ 个 案 数 ”“ 标 准 
差 ” 选 入 “单元 格 统计 ”列表 框 中 ， 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 结果 。 


3. 实验 结果 及 分 析 


单 击 “ 确 定 ” 按 钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 5-7 和 图 5-8 所 示 。 

5-7 给 出 了 平均 值 过 程 的 案例 处 理 摘要 。 该 图 显示 了 平均 值 过 程 中 的 个 案 数 、 已 经 排除 
的 个 案 数目 及 总 计 的 数据 和 相应 的 百分比 ， 可 以 看 出 在 此 次 平均 值 过 程 共 涉及 了 96.3% 的 个 案 。 

图 5-8 给 出 了 平均 值 比 较 结果 报告 。 该 图 中 列 出 了 所 有 工作 经 验 级 别 〈 共 6 个 级 别 ) 的 员 
工 每 小 时 薪水 的 平均 值 情况 和 相应 的 个 案 数 目 、 标 准 差 ， 可 以 发 现 随 着 工作 经 验 的 增长 ， 员 工 
的 每 小 时 薪水 的 平均 值 呈 稳 定 上 升 趋势 ,但 这 种 差异 是 否 显著 需要 进一步 借助 方差 分 析 的 方法 
才能 确定 。 


报告 
每 小 时 新 水 

工作 些 和 图 《年 ) 斤 均 值 个 寄 数 标准 答 
小 手 等 5 179088 90 383747 
个 案 处 理 摘要 人 10 185160 146 361313 
个 名 1115 196319 165 3.88628 
包括 堆 除 总 计 415-20 205715 113 3.76894 
案 数 ”| 百分比 个 家 数 | 百分比 个 农 数 | 百分比 21-35 211796 59 414743 
你 小 时 焊 水 “工作 嗓 驼 578 。 963% 22 37% 600 1000% 大 了 等 了 3 197425 5 041 
(年 ) 对 194244 578 397317 

图 5-7 个 案 处 理 摘要 图 5-8 平均 值 比 较 报 告 
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5.2 单 样本 TT 检验 


“ 单 样本 工 检验 ”过 程 检验 单个 变量 的 平均 值 是 否 与 指定 的 常数 不 同 。 本 节 将 对 SPSS 中 
的 “ 单 样本 T 检验 ”过 程 及 相关 操作 进行 讲解 。 


5.2.1 单 样本 工 检验 的 简介 


“ 单 样本 T 检验 ”过 程 将 单个 变量 的 样本 平均 值 与 假定 的 常数 相 比 较 ， 通 过 检验 得 出 预 
先 的 假设 是 否 正确 的 结论 。 例 如 : 利用 “ 单 样本 T 检验 ”可 以 检验 某 班级 的 某 次 期 末 考 试 数 
学 成 绩 平均 分 是 否 等 于 去 年 考试 的 平均 成 绩 。 对 于 每 个 检验 变量 将 输出 平均 值 、 标 准 差 和 平均 
值 标准 误差 ， 每 个 数据 值 和 假设 的 检验 值 之 间 的 平均 差 、 检 验 此 差 为 0 的 + 检验 、 以 及 此 差 的 
置信 区 间 。 

另外 ，“ 单 样本 检验 ”过 程 一 般 要 求 检验 假设 数据 正 态 分 布 。 但 是 ， 此 检验 对 偏离 正 
态 性 也 是 相当 稳健 的 。 


5.2.2 单 样本 T 检验 的 SPSS 操作 
打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 
进行 单 样本 工 检验 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 比 较 平 均值 ” |“ 单 样本 工 检验 ”命令 ， 打 开 如 图 5-9 所 示 
的 “ 单 样本 工 检验 ”对 话 框 。 

2) 选择 变量 。 

从 源 变量 列表 框 中 选择 需要 检验 的 变量 ， 然 后 单 击 较 按 钮 将 选中 的 变量 选 入 “检验 变量 ” 
列表 框 中 ， 可 以 同时 选择 多 个 检验 变量 。 其 中 , “检验 变量 ”的 度量 标准 为 度量 变量 ， 数 据 类 
型 为 数值 型 。 

3) 进行 相应 的 设置 。 

“选项 ”设置 

单 击 对 话 框 右 侧 的 “选项 ”按钮 ， 弹 出 如 图 5-10 所 示 的 “ 单 样 本 工 检验 : 选项 ”对 话 框 。 


生生 寿 不 T 检 验 


x 

SD: 

| 加 
权益 [0] 


Gs] “oe Ee Cah) md) 
图 5-9 “ 单 样本 工 检验 ”对 话 框 图 5-10 “ 单 样本 工 检验 : 选项 ”对 话 框 
“ 单 样本 工 检验 : 选项 ”对 话 框 主要 对 置信 区 间 和 缺失 值 进行 设置 。 
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中 “置信 区 间 百 分 比 ”文本 框 。 该 文本 框 用 于 指定 输出 结果 中 的 平均 值 置信 区 间 ， 输 入 
范围 是 1-99， 系 统 默 认为 95。 

@ “缺失 值 ” 选项 组 。 该 选项 组 用 于 当 检 验 多 个 变量 ， 有 一 个 或 多 个 变量 的 数据 缺失 时 ， 
可 以 指定 检验 剔除 哪些 个 案 ， 主 要 包含 两 个 单 选项 ; 


。 按 具体 分 析 排 除 个 案 (A) ， 表示 每 个 t 检验 均 使 用 对 于 检验 的 变量 具有 有 效 数据 的 全 部 
个 案 ， 此 时 样本 大 小 可 能 随 T 检验 的 不 同 而 不 同 ; 

。 成 列 排除 个 案 ( 工 ) ， 表 示 每 个 t 检验 只 使 用 对 于 在 任何 请 求 的 t 检验 中 使 用 的 所 有 变量 
都 具有 有 效 数 据 的 个 案 ， 此 时 样本 大 小 在 各 个 了 检验 之 问 恒定 。 


检验 值 

“ 单 样本 T 检验 ”对 话 框 中 的 “检验 值 ”文本 框 用 来 输入 一 个 假设 的 检验 值 ， 如 果 要 检 
验 一 个 高 中 所 有 男生 的 平均 身高 是 否 与 去 年 全 国 高 中 男生 的 平均 身高 一 致 ,那么 此 处 应 该 输入 
的 检验 值 就 是 去 年 全 国 高 中 男生 的 平均 身高 数 。 

4) 结果 输出 。 

设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 单 样本 工 检验 的 
结果 。 


5.2.3 ”实验 操作 
下 面 将 以 “5-2” 数 据 文件 为 例 ， 讲 解 单 样本 工 检验 的 具体 操作 过 程 并 对 结果 进行 说 明 。 
1. 实验 数据 描述 


“5-2” 数 据 文件 显示 的 是 某 饮料 三 月 份 在 80 个 销售 网 点 的 销售 量 , 根据 市 场 预 测 模型 的 
分 析 ， 该 饮料 在 各 销售 网 点 的 平均 销量 为 80 箱 。 下 面 将 利用 单 样本 检验 来 分 析 该 饮料 的 实 
际 销量 与 市 场 预测 模型 的 预测 是 否 一 致 。 原 始 Excel 数据 文件 如 图 5-11 所 示 。 

在 SPSS 变量 视图 中 建立 变量 “网 点 编号 ”和 “销售 量 ”, 分 别 表示 销售 网 点 和 销售 数量 ， 
如 图 5-12 所 示 。 


和 eT RS] -BM SPSS Sististics BR Sa 
EL 


| EC 加 
的 3 0 合同 占 二 号 无 无 8 下 右 少 和 i 良 输入 
2 nee WF 8 0 以 机 的 请 旦 无 无 5 草 右 ” 少 上 展 N 叙 入 


3] 


PSS Sasics Mi 所 训 绩 | Unicode ON 


5-11 “5-2” 数 据 文件 的 原始 数据 图 5-12 “5-2” 数 据 文件 的 变量 视图 
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在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 搜集 的 数据 输入 到 各 个 变量 中 ， 输 入 完毕 后 部 分 
数据 如 图 5-13 所 示 。 


Tt -EN SPSS Statistics EERE = 
EG 寺 奋 |。 革 要 D) 半 护 (中 才 件 外。 百 消 UNRG) 天 用 生 FU 扩展 0 再 DG 大 0) 


全 5 
司 视 : 22 个 有 时 
Emer 


FNFNdUYNSI 和 NE 


EN SPSS Sahstcs 外 更衣 培 “| |Unicooe ON 


图 5-13 “5-2” 数 据 文件 的 数据 视图 
2. 实验 操作 步骤 


下 TY 打开 “5-2” 数 据 文 件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 比 较 平 均值 ”|“ 单 样本 了 检验 ”， 弹 出 “ 单 样本 T 检 验 ” 对 话 框 ， 将 “销售 
量 ” 选 入 “检验 变量 ”列表 框 中 ， 在 “检验 值 ”文本 框 中 输入 预测 销量 80。 

本 70> 单 击 “ 选 项 ”按钮 ， 弹 出 “ 单 样本 T 检验 : 选项 ”对 话 框 ， 在 “置信 区 间 百 分 比 ” 
输入 框 中 输入 95， 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 结果 。 


3. 实验 结果 及 分 析 
单 击 “ 确 定 ”按钮 ，SPSS Statistics 查看 器 窗 


口 的 输出 结果 如 图 5-14 和 图 5-15 所 示 。 i 

图 5-14 给 出 了 关于 销售 量 的 单个 样本 统计 量 4 和 机。 人。 术 准 闪 人 v 
情况 ， 从 中 可 以 看 出 ,参与 统计 的 样本 个 数 为 80， 一 J 9 
平均 销售 量 为 78.71 箱 。 图 5-14 单 样 本 统计 量 


图 5-15 给 出 了 饮料 销售 数量 的 单个 样本 工 检验 结果 ， 从 中 可 以 看 出 ，T 检验 的 显著 性 是 
0.281， 大 于 显著 水 平 0.05， 不 能 拒绝 原 假设 。 因 此 此 次 实际 销售 数量 与 销售 模型 的 预测 无 显 
著 差异 。 


单 样本 检验 
检验 值 = 80 
呈 著 性 《 观 差 值 95% 置信 区 同 
t 自由 度 尾 ) 平均 值 差 值 下 限 上 限 
饮料 的 销售 台 -1.085 79 281 -1.288 -3.65 1.08 


5-15 单 样 本 工 检验 
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“独立 样本 T 检验 ”过 程 检验 主要 用 于 检验 两 个 样本 是 否 来 自 具有 相同 平均 值 的 总 体 。 
本 节 将 对 SPSS 中 的 “独立 样本 了 检验 ”过 程 及 相关 操作 进行 讲解 。 
5.3.1 独立 样本 T 检 验 的 
“独立 样本 T 检验 ”过 程 比较 两 个 样本 或 者 两 个 分 组 个 案 的 平均 值 是 否 相 同 。 例 如 : 糖 
尿 病 病人 随机 地 分 配 到 旧 药 组 和 新 药 组 , 旧 药 组 病人 主要 接受 原 有 的 药丸 ,而 新 药 组 病人 主要 
接受 一 种 新 药 。 在 主体 经 过 一 段 时间 的 治疗 之 后 ， 使 用 独立 样本 工 检验 比较 两 组 的 平均 血压 。 
另外 , 个 案 样本 应 随机 地 分 配 到 两 个 组 中 , 从 而 使 两 组 中 的 任何 差别 是 源 自 实验 处 理 而 非 
其 他 因素 。 但 是 很 多 情况 下 却 不 然 ， 例 如 : 比较 男性 和 女性 的 平均 教育 年 龄 则 不 能 应 用 “独立 
样本 了 检验 ”过 程 ， 因 为 人 不 是 随机 指定 为 男性 或 女性 的 。 


5.3.2 ”独立 样本 T 检验 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 独立 样本 了 检验。 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 比 较 平均 值 ”| “独立 样本 T 检验 ”命令 ， 打 开 如 图 5-16 
所 示 的 “独立 样本 工 检验 ”对 话 框 。 

2) 选择 变量 。 

从 左 侧 源 变 量 列表 框 中 选择 需要 检验 的 变量 ， 单 击 国 按 钮 将 其 先入 右 侧 的 “检验 变量 ” 
列表 框 中 ， 再 从 左 侧 源 变 量 列表 框 中 选择 分 组 变量 ， 单 击 央 按钮 将 其 变量 选 入 右 侧 的 “分 组 
变量 ”列表 框 中 。 

Q@ 检验 变量 。 该 列表 框 中 的 变量 为 要 进行 了 检验 的 目标 变量 ， 一 般 为 度量 变量 ， 变 量 属 
性 为 数值 型 。 

@ 分 组 变量 。 该 列表 框 中 的 变量 为 分 组 变量 ， 主 要 用 于 对 检验 变量 进行 分 组 。 分 组 变量 
为 分 类 变量 ， 其 取 值 可 以 为 数字 ， 也 可 以 为 字符 串 。 一 旦 指定 分 组 变量 后 , “定义 组 ”按钮 就 
会 被 激活 ， 弹 出 “定义 组 ”对 话 框 ， 如 图 5-17 所 示 ， 其 用 于 对 分 组 变量 进行 设置 。 


简介 


+t 


帮教 学 IMath] 


少 汪 多 [chinesa] 


= | 
5-16 “独立 样本 工 检验 ”对 话 框 5-17 “定义 组 ”对 话 框 
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。 如 果 分 组 变量 是 名 义 变量 ， 可 利用 “使 用 指定 的 值 ” 进 行 分 组 定制 ， 对 于 短 字符 串 分 组 变 
量 , 在 “组 1” 中 输入 一 个 字符 串 ， 在 “组 2” 中 输入 另 一 个 字符 串 ， 具 有 其 他 字符 串 的 
个 案 将 从 分 析 中 排除 ; 
。 如 果 分 组 变量 是 连续 的 度量 变量 ， 也 可 利用 “使 用 指定 的 值 ”进行 分 组 定制 ， 在 “组 1” 
中 输入 一 个 值 ， 在 “组 2” 中 输入 另 一 个 值 ， 具 有 任何 其 他 值 的 个 案 将 从 分 析 中 排除 ， 若 
使 用 “分 割 点 ”设置 分 割 点 ， 输 入 一 个 将 分 组 变量 的 值 分 成 两 组 的 数字 ， 值 小 于 割 点 的 所 
有 个 案 组 成 一 个 组 ， 值 大 于 等 于 割 点 的 个 案 组 成 另 一 个 组 。 
设置 完 “定义 组 ”后 ， 单 击 “ 继 续 ” 按钮 ， 返 回 到 “独立 样本 工 检验 ”对 话 框 ， 如 图 5-18 
所 示 。 
3) 进行 相应 的 设置 。 
“选项 ”设置 
单 击 对 话 框 右 侧 “选项 ”按钮 ， 弹 出 “独立 样本 了 检验 : 选项 ”对 话 框 ， 如 图 5-19 所 示 。 
“独立 样本 T 检验 : 选项 ”对 话 框 包括 一 个 文本 框 和 一 个 选项 组 ， 选 项 与 含义 完全 同 单 


样本 工 检验 。 
由 独立 样本 T 检 验 
妙语 文 [Chinesej 
蛤 独立 样本 T 检 验 : 选项 。 X 
置信 区 间 百 分 比 C): 国 ”|% 
分 组 变量 (G): pap 
四 加 技 有 人 分析 排队 个案 和 
日 成 列 排 除 个 案 (L) 
EEIEIENIED 
图 5-18 “独立 样本 工 检验 ”对 话 框 图 5-19 “独立 样本 T 检 验 ， 选 项” 对话 杠 
4) 分 析 结果 输出 。 
设置 完毕 后 , 单 击 “ 确 定 ” 按 钮 , 即 可 在 SPSS Statistics | 
查看 器 窗口 得 到 独立 样本 工 检验 的 结果 。 Em I 
5.3.3 “实验 操作 四 本 多 一 一 入 
下 中 一 班 62 72 
下 面 将 以 “5-3” 数 据 文 件 为 例 ， 讲 解 独立 样本 T 检 | = 站 多 8 
验 的 具体 操作 过 程 并 对 结果 进行 说 明 。 国 = 加 机 
1. 实验 数据 描述 10 三 班 64 58 
11 一 班 66 54 
“5-3” 数据 文件 记录 了 两 个 班级 学 生 的 数学 成 绩 、 语 | 三 国 多 
文成 绩 信息 ， 以 此 数据 文件 为 例 ， 利 用 描述 性 统计 分 析 分 | 他 == 班 67 71 
析 该 数据 文件 中 的 一 些 基本 统计 量 。 原 始 Excel 数据 文件 | 车 大 如 


5-20 所 示 。 
如 图 所 示 图 5-20 “5-3” 数 据 文件 的 原始 数据 
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在 SPSS 变量 视图 中 建立 变量 “id”“Math” 和 “Chinese”， 分 别 表示 班级 、 数 学 成 绩 和 
语文 成 绩 ，3 个 变量 的 度量 标准 都 为 “度量 ”， 如 图 5-21 所 示 。 
四 :Tt say 区 本 要 1] -BM SPSS Statistics ges - D x 


文件 四 坊 入 E) 下 看 GD 关 接 D) 状 导 中 却 析 风 看 外 MW) NG) 并 风 各 所 UW) 扩展 0 证 DO 大助 dd) 
日 画 三 CL 


开间 | 到 全 | 风色 
沽 石 。 妨 村 大 入 六 入 
下 流入 
EE- 2 


BM SPSS Statshcs 外 埋 各 所 线 Unicooe ON 


图 5-21 “5-3” 数 据 文件 的 变量 视图 


在 SPSS 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 。 其 中 ，“id” 变 量 中 “1” 表 示 “ 一 
班 ”“2” 表 示 “ 二 班 ”。 输 入 完毕 后 部 分 数据 如 图 5-22 所 示 。 


起 “mT [1] -BM SPSS Statistics MRR "0D 


ga9gansreroangggs 
BISrBRanaNgun 


BV SPSS Stabshcs 外 更 各 所 颖 [Unicooe ON 


5-22 “5-3” 数 据 文件 的 数据 视图 


2. 实验 操作 步骤 
有 具体 操作 步骤 如 下 : 


GESoi 打开 “5-3” 数 据 文件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 比 较 平 均值 | “独立 样本 T 检验 ”， 打 开 “ 独 立 样 本 T 检验” 对 话 框 。 将 “ 数 
学 ”“ 语 文 ” 选 入 “检验 变量 ”列表 框 中 ， 将 “班级 ” 选 入 “分 组 变量 ”列表 框 中 ， 
并 单 击 “ 定 义 组 ”按钮 ， 在 “定义 组 ”对 话 框 的 “组 1” 中 输入 1,“ 组 2” 中 输入 2， 
单 击 “继续 ”按钮 。 
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GE 单 击 “ 选 项 ” 按钮 ， 弹 出 “独立 样本 工 检验 : 选项 ”对 话 框 ， 在 “置信 区 间 百 分 比 ” 
文本 框 中 输入 95， 然 后 单 击 “ 继 续 ” 按钮， 保存 设置 结果 。 

3. 实验 结果 及 分 析 

单 击 “ 确 定 ” 按 钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 5-23 和 图 5-24 所 示 。 


图 5-23 给 出 了 分 组 的 一 些 统计 量 ， 从 中 可 以 看 出 两 个 班 的 数学 和 语文 成 绩 的 平均 值 、 标 
准 差 和 标准 误差 平均 值 等 统计 量 。 例 如 ，1 班 的 数学 和 语文 的 平均 成 绩 要 大 于 2 班 数学 和 语文 


志 


的 平均 成 绩 。 
组 统计 

标准 诬 关 J 

诬 缓 个 案 数 和 均值 标准 区 值 
数学 1 39 78.92 11.212 1.795 
2 41 78.51 10.154 1.586 
语文 1 39 80.59 10.492 1.680 
2 41 79.10 11.229 1.754 

图 5-23 组 统计 


图 5-24 给 出 了 对 本 实验 的 独立 样本 了 检验 的 结果 ， 包 括 莱 文 方差 等 同性 检验 结果 和 平均 
值 等 同性 T 检验 结果 ， 从 中 可 以 可 以 看 出 两 个 班 的 数学 和 语文 成 绩 的 方差 相等 ;假设 方差 相 
等 的 T 检验 结果 即 显著 性 都 大 于 显著 水 平 0.05， 可 以 判断 两 个 班 的 数学 和 语文 成 绩 没有 显著 


差异 。 
独立 样本 检验 
国 答 等 网 性 检 喜 和 均值 等 同性 { 检验 

旺 看 性 《 双 关 值 95% 痛 信 区 辣 

pF 星 著 性 t 自由 应 尾 ) 平均 值 差 值 ”标准 误差 差 值 下 限 上 限 
数学 假定 等 方 交 059 808 .172 78 864 411 2389 -4346 5.168 
不 假定 等 方差 172 76303 864 411 2395 -4360 5.181 
语文 假定 等 方 交 041 839 613 78 541 1.492 2.433 -3.351 6336 
不 假定 等 方 关 614 77977 541 1.492 2429 -3.343 6.327 


图 5-24 独立 样本 检验 


5.4 ”成 对 样本 T 检验 


“成 对 样本 T 检验 ”过 程 用 于 检验 两 个 有 联系 的 正 态 总 体 的 平均 值 是 否 有 显著 差异 。 本 
节 对 SPSS 中 的 “成 对 样本 工 检验 ”过 程 及 相关 操作 进行 讲解 。 


5.4.1 成 对 样本 T 检验 的 简介 


“成 对 样本 检验 ”过 程 可 以 检验 两 个 相关 的 样本 是 否 来 自 具有 相同 平均 值 的 总 体 , 或 
者 检验 两 个 有 联系 的 正 态 总 体 的 平均 值 是 否 有 显著 差异 。“ 成 对 样本 检验 ”可 以 检验 两 种 
类 型 的 配对 样本 。 第 一 种 是 对 同一 组 测试 对 象 进行 测试 前 后 的 配对 比较 , 例如 : 在 对 糖尿 病 病 
人 的 研究 中 , 对 同一 组 病人 在 使 用 新 治疗 方法 前 测量 血液 含 糖 量 , 在 治疗 之 后 再 次 测量 血液 仿 
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糖 量 , 此 时 对 于 该 组 病人 就 会 形成 两 组 测量 数据 样本 。 第 二 种 是 对 测试 对 象 按照 属性 相同 的 两 
个 个 体 进行 配对 ， 然 后 对 配对 后 的 个 体 分 布施 加 不 同 的 处 理 。 例 如 : 对 糖尿 病 病人 按照 年 龄 进 
行 配 对 〈60 岁 的 两 个 病人 配对 ，65 岁 的 两 个 病人 配对 ，…… ) ， 然 后 对 配对 的 病人 分 别 采 用 
不 同 的 治疗 方法 ,这样 就 会 形成 两 组 不 同 的 测量 数据 。 另 外 , 每 对 的 观察 值 应 在 相同 的 条 件 下 
得 到 ， 得 到 的 平均 值 差 应 是 正 态 分 布 的 ， 而 每 个 变量 的 方差 可 以 相等 也 可 以 不 等 。 


5.4.2 ”成 对 样本 T 检验 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 
进行 成 对 样本 了 检验 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 比 较 平均 值 ”| “成 对 样本 T 检验 ”命令 ， 打 开 如 图 5-25 
所 示 的 “成 对 样本 工 检 验 ”对 话 框 。 


力 二 样本 T 检 验 x 


Bj 安里 QD: 
[ey a1 [az | WE 
ET 


凤 | 
四 


.疗程 未 血脂 护 程 未- 


CE ] = ee Ee 


图 5-25 “成 对 样本 工 检验 ”对 话 框 

2) 选择 变量 。 

从 左 侧 源 变量 列表 框 中 选择 需要 检验 的 成 对 变量 ， 然 后 单 击 国 按 钮 将 其 选 入 右 侧 的 “配对 
变量 ”列表 框 中 ， 对 于 每 个 配对 检验 ， 指 定 两 个 定量 变量 〈 定 距 测量 级 别 或 定 比 测量 级 别 )。 对 
于 配对 或 个 案 控制 研究 ， 每 个 检验 主体 的 响应 及 其 匹配 的 控制 主体 的 响应 必须 在 数据 文件 的 相 
同 个 案 中 。 选 定 一 组 成 对 变量 后 ， 可 以 继续 选 定 下 一 组 要 分 析 的 成 对 变量 ， 如 图 5-26 所 示 。 


全 mg 尾 本 T 检 验 


x 

配对 交 量 Q): 
一 一- Cao | 
ET 


1 疗程 初 。 尹 疗程 未 
2 4 疗程 初 - 久 广 程 直 
3 


人 疗 和 自打 护 程 未 - 


图 国 国 


EFI TE 
图 5-26 “成 对 样本 工 检验 ”对 话 杠 
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如 果 选 定 两 组 或 两 组 以 上 的 成 对 变量 ， 可 以 通过 国 或 国 按钮 进行 成 对 变量 之 间 顺 序 的 调 
换 。 另外, 可 以 通过 国 按 钮 调换 成 对 变量 中 的 两 个 变量 之 间 的 顺序 。 

3) “选项 ”设置 。 

单 击 对 话 框 右 侧 的 “选项 ”按钮 ， 弹 出 “成 对 样本 T 检验 选 | Ea) 
项 ”对 话 框 ， 如 图 5-27 所 示 。 a 

“成 对 样本 T 检验 :选项 ”对 话 框 中 的 选项 及 含义 与 单 样本 和 | | OplggfsD 
独立 样本 的 TT 检验 一 致 ， 在 此 不 再 装 述 。 FE 

4) 分 析 结果 输出 。 

设置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 ”图 5-27 “成 对 样本 工 检验 : 
窗口 得 到 成 对 样本 工 检验 的 结果 。 选项 ”对 话 杠 


息 网 d 样 本 T 检 验 : 选项 XX 


5.4.3 ”实验 操作 
下 面 以 “5-4” 数 据 文件 为 例 ， 讲 解 成 对 样本 工 检验 的 具体 操作 过 程 并 对 结果 进行 说 明 。 


1. 实验 数据 描述 


“5-4” 数 据 文件 是 一 种 保健 食品 的 效果 测试 。16 名 高 血压 和 高 血脂 患者 服用 了 一 个 疗程 
的 该 保健 食品 ， 测 试 人 员 测量 了 疗程 前 和 疗程 后 患者 的 相关 数据 。 下 面 将 利用 成 对 样本 T 检 
验 来 检测 该 保健 食品 对 高 血压 和 高 血脂 的 治疗 是 否 有 辅助 作用 。 原始 Excel 数据 文件 如 图 5-28 
所 示 。 


-lw ay ea em 
iA ss ES Sa EE ME 
| 了 RE | 


Ea 6 加 豆 EE 
测试 编号 疗程 初 血压 (Pa) ”疗程 末 血 压 (Pa) “疗程 初 血 联 (mg/dl) 疗程 未 血脂 (mg/d) 
1 180 100 198 192 


1 
2 
2 139 237 225 
4 3 152 118 233 226 
5 4 112 179 172 
6 5 156 97 219 214 
了 6 167 171 169 161 

| 7 138 132 222 210 
9 8 160 123 167 161 
10| 9 107 174 199 193 
11 10 156 92 233 226 
12 11 94 121 179 173 
13 12 107 150 158 154 
14 13 145 159 157 143 

115| 14 186 101 216 206 
16 15 112 148 257 249 
17 16 104 130 151 140 


5-28 “5-4” 数 据 文件 的 原始 数据 


首先 在 SPSS 变量 视图 中 建立 变量 “测试 编号 ” “疗程 初 血压 “疗程 末 血 压 ” “疗程 初 血 
脂 ” 和 “疗程 末 血 脂 ”， 分 别 表 示 测 试 者 的 编号 以 及 疗程 初 与 疗程 末 的 情况 ， 如 图 5-29 所 示 。 

然后 在 SPSS 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 , 输入 完毕 后 部 分 数据 如 图 5-30 
所 示 。 


第 5 章 均值 比较 和 TT 检验 


站 二 ET -IN SPsS Saltics 有 = 
no ma ab nga Wg Sha am spa aaa re et wp 


信康 入 六 入 


BM SP35 Siahshcs 刘 于 和 说 病 ”Unicogs ON 


图 5-29 “5-4” 数 据 文件 的 变量 视图 


于 二 六 


5-30 “5-4” 数 据 文件 的 数据 视图 


2. 实验 操作 步骤 

具体 操作 步骤 如 下 : 

GE56) 打开 “5-4” 数 据 文件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”| “比较 平均 值 ”| “成 对 样本 工 检验 ”， 弹 出 “成 对 样本 工 检验 ”对 话 框 ， 将 “ 疗 
程 初 血压 ”和 “疗程 未 血压 ”作为 一 对 选 入 “配对 变量 ”列表 框 ， 再 将 “疗程 初 血 
”和 “疗程 未 血脂 ”作为 一 对 选 入 “配对 变量 ”列表 框 。 

GES62 单 击 “ 选 项 ”按钮 ， 弹 出 “成 对 样本 T 检验 : 选项 ”对 话 框 ， 在 “置信 区 间 百 分 比 ” 
文本 框 中 输入 95， 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 结果 。 

3. 实验 结果 及 分 析 


单 击 “ 确 定 ” 按 钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 5-31~ 图 5-33 所 示 。 
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图 5-31 给 出 了 本 实验 成 对 样本 的 一 些 统计 量 。 从 该 图 可 以 看 出 病人 血压 和 血脂 在 疗程 前 
后 的 平均 值 、 标 准 差 和 标准 误差 平均 值 等 统计 量 。 从 直观 上 看 ， 病 人 在 疗程 前 后 的 血压 和 血脂 


有 显著 的 差别 。 
成 对 样本 统计 
标 - + 
t 素数 . 
WE i 138.44 16 29040 7260 
生生。 12438 16 29.412 7.353 
本 2 “他 要 初生 山 198.38 16 33472 8.368 


疗程 来 电量 190.31 16 33.508 8.377 


图 5-31 成 对 样本 统计 量 


图 5-32 给 出 了 本 实验 成 对 样本 的 相关 系数 ， 从 中 可 以 看 出 疗程 前 后 血压 的 相关 系数 为 负 
值 , 但 相应 的 概率 值 有 0.283， 表 示 这 个 相关 系数 并 不 可 靠 ; 而 治疗 前 后 血脂 的 相关 系数 为 正 ， 
响应 的 概率 值 为 0.000， 血 脂 相关 系数 十 分 显著 。 


成 对 样本 相公 性 
来 相 估 t 
配对 1 疗 哥 初 血 压 名 疗程 来 刁 压 16 -286 
,配对 2 疗程 初 血 而 芭 疗 入 森 由 重 _ ss 


5-32 ”成 对 样本 相关 性 
图 5-33 给 出 了 本 实验 成 对 样本 的 成 对 样本 工 检验 结果 ， 从 中 可 以 看 到 疗程 前 后 的 血压 和 
脂 之 差 的 平均 值 、 标 准 差 、 标 准 误差 平均 值 、95% 的 置信 区 间 及 工 检验 的 值 、 自 由 度 等 。 由 
于 治疗 前 后 的 血压 工 检验 的 显著 性 是 0.249, 大 于 0.05 的 显著 水 平 ， 所 以 可 以 认为 这 种 保健 食 
品 对 病人 血压 状况 的 改善 并 没有 多 大 作用 ;而 治疗 前 后 的 血脂 工 检验 的 显著 性 是 0.000， 小 于 
0.05 的 显著 水 平 ， 所 以 可 认为 这 种 保健 食品 可 以 有 效 地 改善 病人 的 血脂 状况 。 


jf x 人 t 
配对 1 膏 健 初 晤 压 - 疗程 来 血压 14.063 46.875 11.719 -10.915 39.040 1.200 
配对 2 _ 序 柑 初 血 脐 - 疗程 玉 血 脂 8.063 2886 722 6.525 9.600 11.175 


图 5-33 成 对 样本 检验 


55 上 机 题 


B= 视频 文件 ，\Wideo\ 上 机 是 教学 视频 \chap05.wmv 


[ey 视频 文件 : \sample\ 上 机 题 \chap05\... 


$.1 为 了 比较 两 种 新 材料 的 抗 拉 伸 性 能 ， 分 别 对 两 种 材料 在 不 同情 况 下 进行 了 15 次 实 
验 , 观测 数据 如 下 表 所 示 ( 数 据 路 径 : 视频 文件 \sample\ 上 机 题 \chap05\ 习 题 \ 第 5 章 第 一 题 .sav)。 
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测试 编号 材料 a (N) 材料 b (N) 

7.6 8.0 
2 7.0 6.4 
EE 8.3 8.8 
4 8.2 了 
学 4 6.8 
6 休 乞 9 
了 6.3 
8 8.5 73 
Lb4 7.8 7.0 
10 和 6.5 
11 6.1 4.4 
12 8.9 Lh 
3 

14 

15 


(1) 分 别 计算 两 种 材料 的 平均 值 、 标 准 差 和 标准 误差 平均 值 等 统计 量 。 
(2) 试 在 5% 的 显著 性 水 平 下 ， 对 两 种 材料 进行 独立 样本 T 检验 ， 检 验 两 种 材料 的 抗 拉 

伸 性 能 是 否 有 显著 差异 。 
5.2 已 知 某 地 区 水 样 中 某 种 元 素 的 含量 为 72 毫克 / 升 ， 现 从 某 化 工厂 下 游 水 域 中 抽取 了 20 个 
水 样 ， 观 测 数据 如 下 表 所 示 (数据 路 径 : 视频 文件 sample\ 上 机 题 chap05\ 习 题 第 5 章 第 二 题 sav) 。 


测试 标号 水 质 元 素 含量 mg/L) 
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对 样本 数据 进行 单 样本 工 检 验 ， 判 断 化 工厂 是 否 造 成 了 下 游 水 域 水 质 的 变化 。 


$.3 ”为 验证 某 种 药物 的 疗效 ， 对 35 位 患者 进行 了 观察 。 首 先 记录 了 治疗 前 的 测试 数据 ， 
然后 记录 了 治疗 后 的 测试 数据 。 部 分 观测 数据 如 下 表 所 示 (数据 路 径 ， 视频 文件 sample\ 上 机 
题 \chap05\ 习 题 \ 第 5 章 第 三 题 .sav) 。 


测试 编号 服药 前 (mmHg) 服药 后 (mmHg) 
75.00 71.50 
95.00 90.00 
82.00 80.30 
91.00 87.00 


lwmlelwipl- 


(1) 计算 测试 前 后 的 成 对 样本 的 相关 系数 及 各 组 的 描述 统计 量 。 
(2) 采用 成 对 样本 工 检验 ， 在 5% 的 显著 性 水 平 下 ， 分 析 该 药品 是 否 具 有 显著 的 疗效 。 


$5.4 已 知 某 金 融 单位 所 有 员工 的 工龄 和 年 终 奖金 的 数据 ， 某 人 力 咨 询 机 构 需要 统计 分 析 
该 单位 人 员工 作 资 历 和 年 终 奖金 的 关系 , 试 分 析 单 位 员工 工龄 和 奖金 的 关系 。 部 分 观测 数据 如 
下 表 所 示 〈 数 据 路 径 : 视频 文件 \sample\ 上 机 题 \chap05\ 习 题 \ 第 5 章 第 四 题 .sav) 。 


测试 编号 工龄 (年 ) 奖金 ( 千 元 ) 
13.74 
16.44 
21.39 
11.38 
21.56 
18.12 
13.14 
24.73 


试 利用 平均 值 过 程 来 分 析 该 单位 员工 工龄 和 奖金 的 关系 。 
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前 面 章节 所 介绍 的 参数 检验 ,是 在 已 知 或 假设 总 体 分 布 情况 下 对 总 体 的 相关 参数 进行 估计 
和 检验 。 但 是 在 许多 情况 下 ,我 们 无 法 获得 总 体 分 布 情况 的 相关 信息 ， 于 是 出 现 了 许多 通过 样 
本 检验 关于 总 体 的 相关 假设 的 建议 方法 , 非 参数 检验 就 是 主要 的 方法 之 一 。 非 参数 检验 是 相对 
于 参数 检验 而 言 的 ， 非 参数 检验 由 于 一 般 不 涉及 总 体 参 数 而 针对 总 体 的 某 些 一 般 性 假设 而 得 
名 ， 又 称 为 分 布 自由 检验 。 在 统计 分 析 和 实际 工作 中 非 参数 检验 具有 广泛 的 应 用 。 


6.1 非 参 数 检验 简介 


参数 检验 的 前 提 是 关于 总 体 分 布 的 假设 成 立 ,很 多 情况 下 我 们 无 法 获得 有 关 总 体 分 布 的 相 
关 信 息 。 于 是 , 统计 学 家 提出 了 许多 不 需要 对 总 体 分 布 情况 进行 严格 限定 的 统计 推断 方法 ,这 
类 检验 方法 的 假设 前 提 比 参数 检验 要 少 得 多 并 且 容 易 满足 。 

非 参 数 检验 具有 检验 条 件 宽松 、 对 样本 数据 要 求 较 低 、 计 算 相对 简单 等 优点 。SPSS 的 非 
参数 检验 过 程 提供 了 二 项 检验 、 卡 方 检验 、 两 独立 样本 检验 、 两 配对 样本 检验 、 多 独立 样本 检 
验 、 多 配对 样本 检验 、 游 程 检验 和 单 样本 K-S 检验 8 种 检验 方法 ， 下 面 将 对 各 种 方法 进行 详 
细 介 绍 。 


6.2 卡 方 检验 


卡 方 检验 是 一 种 用 于 判断 样本 是 否 来 自 于 特定 分 布 的 总 体 的 检验 方法 , 其 根据 样本 的 频数 
来 推断 总 体 分 布 与 理论 分 布 是 否 有 显著 差异 。 


6.2.1 卡 方 检验 的 基本 原理 


卡 方 检验 的 零 假设 为 : 样本 所 属 总 体 的 分 布 与 理论 分 布 无 显著 差异 。 卡 方 检验 的 检验 统计 
量 如 公式 〈6-1) 所 示 : 
2_ Wa Na) 
其 中 Nu 表示 观测 频数 ，N。 表示 理论 频数 。x? 值 越 小 , 表示 观测 频数 与 理论 频数 越 接 近 ， 
该 妇 统 计量 在 大 样本 条 件 下 渐进 服从 于 自由 度 为 -1 的 卡 方 分 布 。 如 果 该 zx? 统计 量 小 于 由 显 
著 性 水 平和 自由 度 确定 的 临界 值 ， 则 认为 样本 所 属 的 总 体 分 布 与 理论 分 布 无 显著 差异 。 


6.2.2” 卡 方 检验 的 SPSS 操作 
建立 或 打开 相应 的 数据 文件 后 ， 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 进行 卡 方 检验 。 


(6-1) 
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1) 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 ”|“ 卡 方 ”命令 ， 打 开 如 图 6-1 
所 示 的 “ 卡 方 检验 ”对 话 框 。 

2) 选择 变量 。 

从 源 变 量 列表 框 中 选择 要 进行 卡 方 检验 的 变量 ， 单 击 加 按钮 使 之 选 入 “检验 变量 列表 ” 列 
表 框 中 ， 如 图 6-2 所 示 。 检 验 变 量 可 以 选择 多 个 ，SPSS 会 分 别 对 各 个 变量 进行 卡 方 检验 。 


蛤 卡 万 检验 x 本 上 太夫 x 
检验 突 量 列表 中 : 术 镁 容重 列表 [DD); ET 
[rm | es Er 
国 四 
「 期望 号 力 了 期 户 值 一 一 一 一 一 
加 从 数 反 中 黎 职 (G) 加 所 有 交 别 得 等 () 国 从 教 所 中 新 取 (G) 加 所 有 交往 
Oe 他: Vs Ow: 
tp 后 1 EE 
EE mS 
Ml 
图 6-1 “ 卡 方 检验 ”对 话 框 6-2 卡 方 检验 的 变量 选择 


3) 设置 相应 的 选项 。 

在 对 话 框 中 还 有 两 个 选项 组 及 “精确 ”和 “选项 ”按钮 。 

“期 望 范围 ”选项 组 

该 选项 组 用 于 确定 进行 卡 方 检验 的 数据 范围 。 如 选中 “从 数据 中 获取 ” 单 选 按钮 ，SPSS 
将 使 用 数据 中 的 最 大 值 和 最 小 值 作为 检验 范围 , 用 户 也 可 以 选中 “使 用 指定 范围 ” 单 选 按钮 并 
在 “上 限 ” 和 “下 限 ” 文 本 框 中 输入 定制 的 范围 。 


“期 望 值 ”选项 组 

该 选项 组 用 于 设置 总 体 中 各 分 类 所 占 的 比例 ,包括 “所 有 类 别 相等 ”和 “ 值 ”两 个 单 选 按 
钮 。 系 统 默认 选中 “所 有 类 别 相等 ” 单 选 按钮 ， 即 检验 总 体 是 否 服从 均匀 分 布 ， 用 户 也 可 以 选 
中 “ 值 ” 单 选 按钮 并 在 其 后 的 文本 框 中 输入 指定 分 组 的 期 望 
概率 值 。 注 意 : 值 输入 的 顺序 要 与 检验 变量 递增 的 顺序 相同 。 

“选项 ”按钮 

单 击 “ 选 项 ”按钮 ， 打 开 如 图 6-3 所 示 的 “ 卡 方 检验 : 
选项 ”对 话 框 ， 包 含 “统计 ”和 “人 缺失 值 ”两 个 选项 组 。 

中 “统计 ”选项 组 。 该 选项 组 用 于 设置 输出 的 统计 量 ， 
其 包含 “描述 ”和 “四 分 位 数 ” 两 个 复 选 框 ， 分 别 用 于 输出 
描述 性 统计 量 和 四 分 位 数 。 图 6-3 “ 卡 方 检验 :选项 ”对 话 框 

@“ 缺 失 值 ”选项 组 。 该 选项 组 用 于 设置 缺失 值 的 处 理 方式 ， 其 包含 两 个 单 选 按钮 : “ 按 
检验 排除 个 案 ” 表 示 如 果 指 定 多 个 检验 ,将 分 别 独立 计算 每 个 检验 中 的 缺失 值 ; “成 列 排除 个 
案 ” 表 示 从 所 有 分 析 中 排除 任何 变量 具有 缺失 值 的 个 案 。 
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“精确 ”按钮 ET x 
单 击 “ 精 确 ” 按 钮 ， 打 开 如 图 6-4 所 示 的 “精确 检 mw 

验 "对话 om 
该 对 话 框 用 于 设置 计算 显著 性 水 平 的 方法 ， 有 以 下 样本 数 (): 

3 种 方法 : 人 人 各 


。 仅 渐进 法 : 此 为 SPSS 默认 设置 ， 表 示 显 著 性 水 平 | Nt 哲人 用法 代 其 特攻 法 。 
的 计算 基于 渐进 分 布 假设 . 渐进 方法 要 求 足 够 大 的 。 ?入 坟 三 交尾 SF 入 
样本 容量 ， 如 果 样 本 容量 偏 小 ， 该 方法 将 会 失效 。 olan 

e。 蒙特 卡 洛 法 : 表示 使 用 Monte Carlo 模拟 方法 计算 - 
显著 性 水 平 . 一 般 应 用 于 不 满足 渐进 分 布 假设 的 大 图 54 “精确 检验 ”对 话 柜 
量 数据 。 使 用 时 ， 在 该 单 选 按钮 后 的 文本 框 中 输入 相应 的 置信 水 平和 样本 数 。 

。 精确 : 该 方法 可 以 得 到 精确 的 显著 性 水 平 ， 但 是 其 缺点 是 计算 量 过 大 。 用 户 可 以 设置 相应 
的 计算 时 间 ， 如 果 超 过 该 时 间 ，SPSS 将 自动 停止 计算 并 输出 结果 。 


4) 分 析 结 果 输 出 。 

设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 输出 查看 器 窗口 得 到 卡 方 检 验 的 
结果 。 
6.2.3 ”实验 操作 

下 面 将 以 数据 文件 “6-1” 为 例 ， 讲 解 卡 方 检验 的 操作 。 

1. 实验 数据 描述 


数据 文件 “6-1” 是 将 一 般 子 投掷 300 次 所 得 到 的 各 种 点 数 的 情况 。 以 该 数据 文件 为 例 ， 
进行 卡 方 检验 ， 检 验 般 子 的 投掷 结果 是 否 服从 均匀 分 布 。 原 始 Excel 数据 文件 如 图 6-5 所 示 。 


on 


A B D 下 下 6 H 


6-5 数据 文件 “6-1” 原 始 数据 
在 SPSS 变量 视图 中 建立 变量 “点 数 ”， 表 示 投 撕 贷 子 所 得 到 的 点 数 ， 如 图 6-6 所 示 。 
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在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 
数据 如 图 6-7 所 示 。 


起 Fv 1 - 四 M spss statistics DRS i 
文件 四。 二) 二 看 WV) 孝 据 D) 转 [D 分 析 ) 让 针 M) 本 MG) 实用 程序】 扩 雪 0 再 DG。 大助 td) 


名 释 区 型 “于 大 小 教 位 教 标 等 得 | 埠 失 | 列 对齐 
上 和 宁 8 0 二 次 出 现 占 娄 无 。 无 7 四 右 人 少 度 入 坦 入 


eM SPSS Siatstics 处 于 入 直 者 Unicooe -ON 


图 6-6 数据 文件 “6-1” 的 变量 视图 


起 上访 检 这 数据 sav 孜 据 笃 1] -IBM SPSS Statistics 开刀 各 各 = 闻 ! 三 过 


[LEE 


6-7 数据 文件 “6-1” 的 数据 视图 


2. 实验 操作 步骤 

实验 的 具体 操作 步骤 如 下 : 

ES6i) 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 ” |“ 卡 方 ”命令 ， 打 开 “ 卡 方 
检验 ”对 话 框 。 

本 50》 从 源 变 量 列表 框 中 选择 “点 数 ”变量 ， 单 击 轩 按 钮 使 之 选 入 “检验 变量 列表 ”列表 
框 中 。 


人 GE563 单 击 “选项 ”按钮 ， 打 开 “ 卡 方 检验 选项 ”对 话 框 ， 选 中 的 “描述 ” 复 选 框 ， 单 
击 “ 继 续 ” 按钮， 保存 设置 结果 。 
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3. 实验 结果 分 析 


单 击 “ 确 定 ” 按 钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 6-8~ 图 6-10 所 示 。 
图 6-8 给 出 了 “个 案 数 ”“ 平 均值 ” “标准 差 ”“ 最 小 值 ” 和 “最 大 值 ” 描 述 性 统计 量 ， 
以 表格 形式 列 出 。 
描述 统计 
个 案 数 平均 值 标准 差 最 小 值 最 大 值 
每 次 出 现 点 数 300 3.55 1.644 和 6 


6-8 ”描述 性 统计 量 
6-9 给 出 了 各 种 结果 的 实测 个 案 数 、 期 望 个 案 数 和 残 差 。 
6-10 给 出 了 相关 的 检验 统计 ， 从 中 可 以 看 出 ， 渐 近 显著 性 为 0.111， 我 们 不 能 拒绝 原 假 
设 ， 故 认为 投掷 山子 的 结果 服从 均匀 分 布 。 


每 次 出 现 点 数 检验 统计 
实测 个 案 数 | 朋 望 个 要 数 | 残 每 次 出 砚 点 入 
1 43 500 -70 二 Ee 
2 49 500 -10 
3 56 500 60 自由 度 5 
4 45 500 -50 溺 近 县 车 性 111 
5 66 500 160 a.0 个 单元 格 (0.0%) 
的 期 望 须 率 低 于 5。 
名 人 2 9 期 望 的 最 低 单 元 格 顷 
JE 3% | | 事 为 50.0。 
图 6-9 每 次 出 现 点 数 6-10 检验 统计 


6.3 二 项 检验 


二 项 检验 是 用 于 检验 样本 是 否 来 自 二 项 分 布 总 体 的 一 种 检验 方法 。 
6.3.1 二 项 检验 的 基本 原理 


卡 方 检验 的 零 假设 为 : 样本 所 属 的 总 体 分 布 与 所 指定 的 某 个 二 项 分 布 无 显著 差异 。 二 项 检 
验 的 检验 统计 量 计算 如 公式 6.2》 所 示 : 
了 1 二 1P 
DP Vp 
其 中 中 表示 第 一 个 类 别 的 样本 个 数 ， 表示 指定 二 项 分 布 中 第 一 个 类 别 个 体 在 总 体 中 所 
占 的 比重 。 统 计量 在 大 样本 条 件 下 渐进 服从 于 正太 分布。 如果 该 统计 量 小 于 临界 值 ， 则 认为 样 
本 所 属 的 总 体 分 布 与 所 指定 的 某 个 二 项 分 布 无 显著 差异 。 


(6-2) 


6.3.2 ”二 项 检验 的 SPSS 操作 


建立 或 打开 相应 的 数据 文件 后 ， 在 SPSS 中 便 可 以 进行 二 项 检验 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 ”|“ 二 项 ”命令 ,打开 如 图 6-11 
所 示 的 “二 项 检验 ”对 话 框 。 
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2) 选择 变量 。 

从 源 变量 列表 框 中 选择 要 进行 二 项 检验 的 变量 ， 单 击 国 按钮 使 之 选 入 “检验 变量 列表 ” 
列表 框 中 ， 如 图 6-12 所 示 。 检 验 变量 可 以 选择 多 个 ，SPSS 会 分 别 对 各 个 变量 进行 二 项 检验 。 
上 昌 一 mi 只 Es x FE RE 一 x 
检验 奖 量 列表 CD: Er 检验 变量 列表 CD: ET 
Er ET] 


定义 二 分 法 检验 比 到 E): [定义 二分 法 
回 从 娄 所 中软 取 (G) 回 从 雪 据 中 区 取 (G) 
口 分 点 C): © FPO: 


图 6-11 “二 项 检验 ”对 话 框 图 6-12 二 项 检验 的 变量 选择 

3) 进行 相应 的 设置 。 

定义 二 分 法 

该 选项 组 用 于 定制 将 数据 分 类 的 方式 。 系 统 默认 选中 “从 数据 中 获取 ” 单 选 按钮 ， 这 种 方 
式 适 用 于 按照 二 分 类 方式 录入 的 数据 ; “分 割 点 ”可 以 设置 一 个 分 类 临界 值 ， 大 于 此 值 的 数据 
将 作为 第 一 组 ， 小 于 此 值 的 作为 第 二 组 。 

“检验 比例 ”设置 

“检验 比例 ”文本 框 用 于 设置 检验 概率 ， 系 统 默 认为 0.5， 即 均匀 分 布 。 

“精确 ”与 “选项 ”设置 

单 击 “ 精 确 ” 与 “选项 ”按钮 ， 打 开 “ 精 确 检验 ”与 “二 项 检验 选项 ”对 话 框 。 对 话 框 
的 内 容 与 设置 方式 与 卡 方 检验 相同 ， 读 者 可 以 参考 6.2 节 的 内 容 ， 在 此 不 再 效 述 。 


4) 分 析 结 果 输 出 。 
设置 完毕 后 , 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 二 项 检验 的 结果 。 


6.3.3 ”实验 操作 

下 面 将 以 数据 文件 “6-2” 为 例 ， 讲 解 二 项 检验 的 操作 。 

1. 实验 数据 描述 

袋 中 有 黑白 球 若干 ， 从 袋 中 取 球 。 数 据 文件 “6-2” 是 取 1000 次 小 球 所 得 到 的 黑白 球 的 次 
数 。 以 该 数据 文件 为 例 进行 二 项 检验 ， 求 黑白 球 出 现 的 概率 是 否 服从 二 项 分 布 。 原 始 Excel 
数据 文件 如 图 6-13 所 示 。 

在 SPSS 变量 视图 中 建立 变量 “结果 ”， 表 示 取 球 所 得 的 结果 ， 用 “0、1” 分 别 代替 “ 黑 
球 、 白 球 ”， 如 图 6-14 所 示 。 
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seo 
油 


自 珀 


EREREFEEEREEEER 


图 6-13 数据 文件 “6-2” 原 始 数据 


RM SPSS Siatistics Rm - 0 x 


16M SPSS Stabshcs 处 漂 程 床 角 考 “|Unicoe ON] 
图 6-14 数据 文件 “6-2” 的 变量 视图 


在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 
数据 如 图 6-15 所 示 。 


2. 实验 的 操作 步骤 

实验 的 具体 操作 步骤 如 下 : 

6 本 07 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 ”|“ 二 项 ”命令 ,打开 “二 项 
检验 ”对 话 框 。 

GES62 从 源 变 量 列表 框 中 选择 “结果 ”变量 ， 单 击 国 按 钮 使 之 选 入 “检验 变量 列表 ”列表 
框 中 。 


GE563 单 击 “ 选 项 ”按钮 ， 打 开 “ 二 项 检验 : 选项 ”对 话 框 ， 选 中 “描述 ” 复 选 框 ， 单 击 
“继续 ”按钮 ， 保 存 设 置 结果 。 
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起 二 和 sav 下 也 1] - BM SPSS Statistics 数 富 二 生 


- 0O 


[ET 


6-15 ”数据 文件 “6-2” 的 数据 视图 


3. 实验 结果 分 析 


单 击 “ 确 定 ”按钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 6-16 和 图 6-17 所 示 。 
图 6-16 给 出 的 是 “个 案 数 ”“ 平 均值 ” “标准 差 ”“ 最 小 值 ”和 “最 大 值 ” 描 述 性 统计 量 。 


图 6-17 给 出 了 二 项 检验 统计 量 ， 从 中 可 以 看 出 ， 精 确 显著 性 为 0.000， 故 拒绝 原 假 设 ， 认 
为 取 球 的 结果 不 服从 二 项 分 布 。 


二 项 检验 
和 精确 昌 划 性 
要 A 素数 实 测 比 例 检验 比 侧 ( 双 尾 ) 
的 述 统计 吏 球 结 采 。 遍 1 。 折 半 274 27 50 .000 
组 2 。 号 于 725 73 
1 En 1000 100 


图 6-16 ”描述 性 统计 量 图 6-17 二 项 检验 统计 量 


6.4” 双 独立 样本 检验 


双 独 立 样本 检验 用 于 在 总 体 分 布 未 知 的 情况 下 检验 两 个 样本 是 否 来 自 于 相同 分 布 的 总 体 。 


个 案 数 在 均值 标准 外 
取 球 结果 1000 27 446 0 


6.4.1 双 独 立 样本 检验 的 基本 原理 


双 独 立 样本 检验 主要 通过 对 两 个 独立 样本 的 集中 趋势 、 离 中 趋势 、 偏 度 等 指标 进行 差异 性 
检验 ， 而 分 析 这 两 个 独立 样本 是 否 来 自 于 相同 分 布 的 总 体 。SPSS 提供 了 曼 - 惠 特 尼 U、 柯 尔 葛 
戈 洛 夫 - 斯 米 诺 夫 Z、 莫 斯 极端 反应 和 瓦尔 德 - 沃 尔 福 威 茨 游程 4 种 方法 进行 两 独立 样本 检验 。 
在 进行 检验 前 ， 先 来 了 解 一 下 这 几 种 检验 方法 的 基本 思想 。 

(1) 曼 - 惠 特 尼 可 检验 法 

曼 - 惠 特 尼 检验 法 的 思想 是 检验 两 个 样本 的 总 体 在 某 些 位 置 上 是 否 相同 , 其 基于 对 平均 
等 级 的 分 析 实 现 推断 。 检 验 思路 是 ， 首 先 对 两 个 样本 合并 并 按 升 序 排列 得 出 每 个 数据 的 等 级 ， 
然后 对 这 两 个 样本 求 平均 等 级 , 并 计算 第 一 组 样本 的 每 个 等 级 优 于 第 二 组 样本 的 每 个 等 级 的 个 
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数 和 Vi 和 第 二 组 样本 的 每 个 等 级 优 于 第 一 组 样本 的 每 个 等 级 的 个 数 入, 。 如 果 平均 等 级 和 入 、 
Na 之 间 的 差距 过 大 ， 则 认为 两 个 样本 来 自 于 不 同 的 总 体 。 


(2 ) 柯 尔 莫名 洛 夫 -斯 米 诺 夫 乙 检验 法 

柯 尔 莫 戈 洛 夫 -斯 米 诺 夫 Z 检验 法 的 检验 思路 是 , 首先 对 两 个 样本 合并 并 按 升 序 排列 得 出 
每 个 数据 的 等 级 ,然后 得 出 样本 等 级 的 累积 频率 与 样本 点 的 累积 频率 的 差 值 序列 并 计算 该 序列 
的 KK-SZ 统 计量, 如 果 该 统计 量 的 相伴 概率 显著 性 小 于 显著 性 水 平 则 认为 两 个 样本 的 总 体 分 布 
具有 显著 性 差异 。 


(3 ) 英 斯 极端 反应 检验 法 

莫 斯 极 端 反应 检验 法 是 将 一 个 样本 作为 实验 样本 , 另 一 个 样本 作为 控制 样本 , 再 将 两 个 样 
本 合并 按 升序 排列 得 出 每 个 数据 的 等 级 并 计算 控制 组 的 跨度 ( 即 控制 组 样本 中 最 大 等 级 和 最 小 
等 级 之 间 包 含 的 样本 个 数 》， 然 后 忽略 取 值 极 高 和 极 低 的 各 5% 数 据 后 计算 截 头 跨度 。 如 果 跨 
度 和 裤头 跨度 相差 较 大 ， 则 认为 两 个 样本 存在 极限 反应 ， 其 总 体 分 布 具 有 显著 性 差异 。 

(4) 瓦尔 德 - 沃 尔 福成 英 游程 检验 法 

瓦尔 德 - 沃 尔 福 威 蒋 游 程 检验 法 的 思想 是 检验 两 个 样本 是 否 被 随机 赋 等 级 。 检 验 思路 是 ， 
首先 对 两 个 样本 合并 并 按 升序 排列 ， 然 后 对 样本 标志 值 序列 求 游程 ， 如 果 得 到 的 游程 数 较 小 
则 认为 两 个 样本 的 总 体 分 布 具有 显著 性 差异 。 


6.4.2” 双 独立 样本 检验 的 SPSS 操作 


建立 或 打开 相应 的 数据 文件 后 , 在 SPSS 中 便 有 
可 以 进行 双 独 立 样本 检验 。 tuna 
1) 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ” Lamo 
|“ 旧 对 话 框 ”| “2 个 独立 样本 ”命令 ， 打 开 如 图 
6-18 所 示 “ 双 独立 样本 检验 ”对 话 框 。 an 
2) 选择 变量 。 | 区 
从 源 变量 列表 框 中 选择 要 进行 双 独立 样本 检 [sa 
验 的 变量 ， 单 击 国 按钮 使 之 选 入 “检验 变量 列表 ” Ba mm 
列表 框 中 , 同时 选择 分 组 变量 , 单 击 加 按钮 使 之 选 [二] oa 匡 是 恒 浊 鲁 喝 
入 “分 组 变量 ”列表 框 中 ， 此 时 “定义 组 ” 按钮 被 一 一 一 一 一 一 一 一 一 一 一 一 一 
激活 ， 如 图 6-19 所 示 。 图 6-18 “ 双 独 立 样本 检验 ”对 话 框 


单 击 “ 定 义 组 ”按钮 ， 弹 出 如 图 6-20 所 示 的 “ 双 独 立 样本 : 定义 组 ”对 话 框 。 

“组 1” 文 本 框 用 于 输入 代表 第 一 组 变量 的 数值 ，“ 组 2” 文本 框 用 于 输入 代表 第 二 组 变 
量 的 数值 。 输 入 完毕 后 单 击 “ 继 续 ” 按 钮 返回 主 对 话 框 。 

3) 进行 相应 的 设置 。 

“检验 类 型 ”设置 

“检验 类 型 ”选项 组 用 于 设置 所 进行 的 检验 : 曼 - 惠 特 尼 U、 柯 尔 莫 戈 洛 夫 -斯 米尔 诺 夫 Z、 
英 斯 极端 反应 和 瓦尔 德 - 沃 尔 福 威 茨 游程 检验 法 。 
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晤 RaRr 放 让 检验 x 


慷 安 星球 中 : 
勋 而 人 搞 号 ID | 基 生 舌 行为 衣 力 折 为 、 [| 


国 迪 时 一 一 
i Exao.) 


国 且 高 桂 尼 U(M) 器 柯 尔 黄 疙 省 夫 扬 米 庄 夫 ZK) 
已 莫 斯 机 油 反 应 (S) 门 瓦尔 德 沃 尔 福 威 沪 划 程 GD) 


[二 we Eg Ee 
图 6-19 选择 变量 图 6-20 “ 双 独 立 样本 : 定义 组 ”对 话 框 
“精确 ”和 “选项 ”设置 
内 容 和 设置 方式 同样 与 卡 方 检验 相同 ， 可 参考 6.2 节 的 内 容 ， 在 此 不 再 歼 述 。 


4) 分 析 结 果 输 出 
设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 双 独 立 样本 检验 
的 结果 。 


6.4.3 ”实验 操作 


下 面 以 数据 文件 “6-3” 为 例 ， 讲 解 双 独 立 样本 检验 的 操作 。 
1. 实验 数据 描述 


数据 文件 “6-3” 是 两 组 中 风 患 者 治疗 结果 的 数据 。 其 中 ， 第 一 组 患者 接受 标准 的 药物 治 
疗 , 第 二 组 患者 接受 附加 物理 治疗 , 分 析 两 种 治疗 方法 的 结果 是 否 有 显著 差异 。 实 验 的 原始 数 
据 如 图 6-21 所 示 。 


3 Pe" 
2 时 床 
R 而 i 行为 能 力 
物 治疗 人 


是 可 以 自主 活动 
2 站 


旺 E7 
ee 王 可 以 自主 活动 
二 物理 治疗 Sa 


物理 于 

13 15 药 槐 臣 床 

| 16 物 理 治 疗 可 以 自主 活动 
15 17 药物 党 江 可 以 自主 
16 坪 物 理 治疗 人 
ral 2 司 以 自主 
18 物理 治疗 二 

| 副 物 人 忆 床 
20| 多 多 琴 分 院 体 可 以 自主 活动 
有 | 治疗 区 床 
22| 国人 8 
2 和 5 药物 
24 | 26 DE NE 
25 | 27 物理 洛 
26| 委 物 建 洁 闻 革 介 医术 可 以 二 活动 
En 2 物理 治疗 可 以 自 译 活动 


图 6-21 数据 文件 “6-3” 原 始 数据 
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在 SPSS 变量 视图 中 建立 变量 “ID ”“ 组 别 ” 和 “行为 能 力 ”， 分 别 表 示 病 人 编号 、 所 属 
治疗 组 和 行为 能 力 ， 其 中 用 “0、1” 分 别 代替 “药物 治疗 、 物 理 治 疗 ”,， 用 “0、1、2、3、4” 


分 别 表示 “正常 、 可 以 自主 活动 、 部 分 肢体 可 以 自主 活动 、 卧 床 、 无 行为 能 力 ”， 如 图 6-22 
所 示 。 


二 RE 丰 于 sr 区 如 1] - IgM SPss statistics 和 将 


各 失 到 | 对齐 | 到 图 | 角 色 | 
无 8 蛋 右 高 各 X 给 入 
4 六 无 “日 性 右 AP 标量 输入 
无 “8 性 右 大 有 输入 


生活 行为 能 力 的 , 正 ] 


SPSS Sabistcs 旭 担 程序 扩 夫 | Unicode ON 


6-22 ”数据 文件 “6-3” 的 变量 视图 


在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ， 输 入 完毕 后 的 部 分 
数据 如 图 6-23 所 示 。 


起 了 立 FrtGi8 vav 次 妆 类 1 IBM SPsS Statistics 数 和 入 叶 当 


图 6-23 数据 文件 “6-3” 的 数据 视图 


2. 实验 的 操作 步骤 
实验 的 具体 操作 步骤 如 下 : 


GES6i 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 ”|“2 个 独立 样本 ”命令 ， 打 
开 “ 双 独立 样本 检验 ”对 话 框 。 
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EV 从 源 变量 列表 框 中 选择 “行为 能 力 ”变量 ， 单 击 较 按 钮 使 之 选 入 “检验 变量 列表 ” 
列表 框 中 ， 选 择 “ 组 别 ” 变 量 ， 单 击 畏 按钮 使 之 选 入 “分 组 变量 ”列表 框 中 ， 单 击 
“定义 组 ”按钮 ， 弹 出 “ 双 独 立 样 本 : 定义 组 ”对 话 框 ， 输 入 两 组 的 组 标记 值 。 

ES63 单 击 “ 选 项 ”按钮 ， 在 “ 双 独立 样本 : 选项 ”对 话 框 中 选中 “描述 ” 复 选 框 ， 单 击 
“继续 ”按钮 。 

本 01 在 “检验 类 型 ”选项 组 中 ， 选 中 “ 曼 - 惠 特 尼 U”“ 莫 斯 极端 反应 ”和 “ 柯 尔 莫 戈 洛 
夫 - 斯 米 诺 夫 Z” 复 选 框 。 

3. 实验 结果 分 析 


单 击 “ 确 定 ”按钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 6-24~ 图 6-26 所 示 。 

图 6-24 给 出 了 两 个 变量 的 “个 案 数 ”“ 平 均值 ”“ 标 准 差 ”“ 最 小 值 ”和 “最 大 值 ” 描 
述 性 统计 量 。 

6-25 给 出 了 曼 - 惠 特 尼 U 检验 相关 的 检验 统计 量 ， 从 中 可 以 看 出 ， 渐 近 显 著 性 为 0.03， 
小 于 显著 性 水 平 。 故 拒绝 原 假设 ， 认 为 两 种 治疗 方法 的 结果 具有 显著 性 差异 。 


检验 统计 ” 


行为 能 力 
受 吉 特 尼 U 940.000 


碱 尔 科 克 森 W 2425.000 

a Ne a -2.165 

华 话 行为 能 力 100 测 近 县 著 性 《 双 尾 》 030 
着 疗 组 100 3. 分 担 变 便 ; 沪 疗 组 


6-24 ”描述 性 统计 量 6-25” 曼 - 惠 特 尼 U 检验 统计 量 


图 6-26 给 出 了 莫 斯 极 端 反应 检验 相关 的 检验 统计 量 ， 从 中 可 以 看 出 ， 在 排除 极端 值 后 ， 
显著 性 为 0.011, 小 于 显著 性 水 平 。 故 拒绝 原 假设 ， 认 为 两 种 治疗 方法 的 结果 具有 显著 性 差异 。 

图 6-27 给 出 了 柯 尔 莫 戈 洛 夫 -斯 米 诺 夫 Z 检验 的 相关 统计 量 ， 从 中 可 以 看 出 ， 渐 近 显 著 
性 为 0.302, 也 大 于 显著 性 水 平 。 故 不 能 拒绝 原 假设 , 认为 两 种 治疗 方法 的 结果 无 显著 性 差异 。 


检验 统计 ab 检验 统计 a 
LE 生活 行为 能 力 
实测 控制 组 范围 90 最 极 消 效 值 ”绝对 195 
显著 性 〈 剃 尾 ) 008 到 证 
昼 队 后 控制 担 基 度 79 - 
县 车 性 《 单 尾 ) 011 负 2400 
在 两 泣 前 除了 离 群 人 2 柯 尔 瑞 是 洛 夫 -斯 米 请 夫 ZZ 971 
3a. 英 斯 检验 责 近 显著 性 《 双 尾 ) .302 
.分担 变 各 治疗 组 a. 分 组 变量 :治疗 组 
图 6-26 黄 斯 极端 反应 检验 统计 量 图 6-27 柯 尔 莫 戈 洛 夫 -斯 米 诺 夫 Z 检验 统计 量 


从 本 例 的 分 析 对 比 中 可 以 看 出 ， 不 同 的 检验 方法 会 导致 不 同 的 结论 ， 这 提示 我 们 一 定 要 根 
据 数 据 的 性 质 和 各 检验 方法 的 侧重 点 合理 地 选择 , 建议 在 检验 前 进行 探索 性 分 析 获 取 相关 信息 。 

“ 曼 - 惠 特 尼 U” 检 验 法 常用 于 判别 双 独 立 样本 所 属 的 总 体 是 否 具有 相同 的 分 布 ，“ 莫 斯 
极端 反应 ”和 “ 柯 尔 莫 戈 洛 夫 -斯 米 诺 夫 Z” 检 验 法 主要 用 于 检验 两 个 样本 是 否 来 自 于 相同 总 
体 的 假设 。 因 此 在 本 例 中 ， 建 议 选择 “ 曼 - 惠 特 尼 U” 检 验 法 。 
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6.5 ”多 独立 样本 检验 


多 独立 样本 检验 用 于 在 总 体 分 布 未 知 的 情况 下 检验 多 个 样本 是 否 来 自 于 相同 分 布 的 总 体 。 


6.5.1 多 独立 样本 检验 的 基本 原理 


多 独立 样本 检验 的 基本 原理 与 双 独 立 样本 相同 , 双 独 立 样本 检验 是 多 独立 样本 检验 的 特殊 
情况 。SPSS 提供 了 克 鲁 斯 卡尔 - 沃 利 斯 HH、 约克 海尔 - 塔 帕 斯 特 拉 和 中 位 数 3 种 检验 法 方法 进 
行 多 独立 样本 检验 。 


(1) 克 鲁 斯 卡尔 - 活 利 斯 卫 检 验 法 

克 鲁 斯 卡尔 - 沃 利 斯 联 是 曼 - 惠 特 尼 U 检验 法 的 扩展 ， 是 一 种 推广 的 评价 值 检验 。 其 基本 
思路 是 ,首先 对 所 有 样本 合并 并 按 升序 排列 得 出 每 个 数据 的 等 级 , 然后 对 各 组 样本 求 平均 等 级 。 
如 果 平 均等 级 相差 很 大 ， 则 认为 两 组 样本 所 属 的 总 体 有 显著 差异 。 


(2) 约克 海尔 - 塔 帕 斯 特 拉 检 验 法 

约克 海尔 - 塔 帕 斯 特 拉 检验 法 是 在 总 体 -排序 的 前 提 下 具有 较 高 的 检验 效率 。 其 检验 思路 与 
两 独立 样本 下 的 曼 - 惠 特 尼 U 检验 法 相似 , 计算 某 组 样本 的 每 个 等 级 优 于 其 他 组 样本 的 每 个 等 
级 的 个 数 。 如 果 这 些 数据 差距 过 大 ， 则 认为 两 组 样本 所 属 的 总 体 有 显著 差异 。 


(3 ) 中 位 数 检验 法 

中 位 数 检验 法 的 基本 思路 是 , 首先 将 所 有 样本 合并 并 计算 中 位 数 , 然后 计算 各 组 样本 中 大 
于 或 小 于 这 个 中 位 数 的 样本 的 个 数 。 如 果 这 些 数据 差距 过 大 , 则 认为 两 组 样本 所 属 的 总 体 有 显 
著 差 异 。 


6.5.2 ”多 独立 样本 的 SPSS 操作 


建立 或 打开 相应 的 数据 文件 后 , 便 可 以 在 SPSS ee > 
中 进行 多 独立 样本 检验 。 MazanaD， [站 


培训 考试 得 分 四 分 ] 
1) 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”| | 
“ 旧 对 话 框 ?|“K 个 独立 样本 ”命令 , 打开 如 图 6-28 
所 示 的 “针对 多 个 独立 样本 的 检验 ”对 话 框 。 国志 一 
2) 选择 变量 。 二 See 
量 ， 单 击 按钮 使 之 选 入 “检验 变量 列表 ” 现 
表 框 中 ， 选 择 要 进行 分 组 的 变量 ， 单 击 按钮 使 之 EE 加 本 加 且 G 
输入 分 组 变量 ， 如 图 6-29 所 示 。 图 6-28 “针对 多 个 独立 样本 的 检验 ”对 话 框 
单 击 “定义 范围 ”按钮 ， 弹 出 如 图 6-30 所 示 的 “多 个 独立 样本 :定义 范围 ”对 话 框 。 
该 对 话 框 中 包含 两 个 文本 框 ， 即 “最 小 值 ” 和 “最 大 值 ”， 用 于 设置 分 组 变量 的 范围 
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才 针对 多 个 独立 样本 的 检验 x 


国 细 一 
[ESET 


网 克 生 卡尔 活 利 HQ 加 中 位 孝公) 
OD 


图 6-29 针对 多 个 独立 样本 的 检验 变量 选择 图 6-30 “多 个 独立 样本 : 定义 范围 ”对 话 框 
3) 进行 相应 的 设置 。 与 双 独立 样本 检验 相同 ， 选 择 所 要 进行 检验 的 类 型 和 其 他 设置 。 
4) 分 析 结果 输出 。 

设置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 多 独立 样本 检验 
的 结果 。 


6.5.3 ”实验 操作 
下 面 以 数据 文件 “6-4” 为 例 ， 讲 解 多 独立 样本 检验 的 操作 。 
1. 实验 数据 描述 


数据 文件 “6-4” 是 三 组 采用 不 同 销售 人 员 的 培训 得 分 的 数据 ， 利 用 多 独立 样本 检验 分 析 
三 组 销售 人 员 的 培训 得 分 是 否 有 显著 差异 。 本 实验 的 原始 数据 如 图 6-31 所 示 。 

在 SPSS 变量 视图 中 建立 变量 “组 ”和 “得 分 ”， 分 别 表示 销售 培训 组 和 考试 得 分 ， 如 图 
6-32 所 示 。 


FE | 


机 我 本 丰 堆 答 sav | 粘 当 时 1] - 四 M SPS5 Statistics 短 握 六 各 四 - Do 


和 让 竺 芝 入 | 摧 失 | 列 对 齐 | 到 时 | 角色 
请 入 后 组。 无 。 无 8 对 右 少林 良和 \ 久 入 
二 者 试 站 人 “无 无 “日 测 右 仿 标 及 \ 钙 入 


1 SPSS Sagstcs 和 扩 缚 | | JunicodeON| | 


6-31 数据 文件 “6-4” 原 始 数据 6-32 ”数据 文件 “6-4” 的 变量 视图 
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在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 
数据 如 图 6-33 所 示 。 


| 起  cav 四 本 11 - IBM SPSS Statistics RR 和 = 0 


~» 


四 


站 


aa 


= 


ee 


eM SPSS Stalistics 外 更 程序 角 绪 Unicode ON I 


6-33 ”数据 文件 “6-4” 的 数据 视图 


2. 实验 操作 步骤 

实验 的 具体 操作 步骤 如 下 : 

GES6i) 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 ” |“K 个 独立 样本 ”命令 ， 打 
开 “ 针 对 多 个 独立 样本 的 检验 ”对 话 框 。 

E3702 从 源 变 量 列表 框 中 选择 “得 分 ”变量 ， 单 击 国 按 钮 使 之 选 入 “检验 变量 列表 ”列表 
框 中 ， 选择“ 组 ”变量 ， 单 击 国 ) 按 钮 使 之 选 入 “分 组 变量 ”列表 框 中 ， 单 击 “ 定 义 
范围 ”按钮 ， 在 “多 个 独立 样本 : 定义 范围 ”对 话 框 中 输入 分 组 变量 的 范围 。 

GES63 单 击 “ 选 项 ”按钮 打开“ 多 个 独立 样本 : 选项 ”对 话 框 ， 选 中 “描述 ” 复 选 框 ， 
单 击 “ 继 续 ” 按 钮 。 

(GE363 在 “检验 类 型 ”选项 组 中 选中 全 部 选项 。 


3. 实验 结果 分 析 


单 击 “确定 ”按钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 6-34~ 图 6-37 所 示 。 
图 6-34 给 出 了 两 个 变量 的 个 案 数 、 平 均值 、 标 准 差 、 最 小 值 和 最 大 值 描述 性 统计 量 。 


描述 统计 
个 案 数 。 | 平均 值 。 标准 差 最 小 值 。 ”最 大 什 
培训 考试 得 分 60 721422 12.00312 32.68 89.69 


销售 培训 组 60 2.00 .823 1 3 


6-34 ”描述 性 统计 量 


图 6-35 给 出 了 克 鲁 斯 卡尔 - 沃 利 斯 HH 检验 相关 的 检验 统计 量 ， 从 中 可 以 看 出 ， 渐 近 显 著 
性 为 0.000， 小 于 显著 性 水 平 。 故 拒绝 原 假 设 ， 认 为 三 组 销售 人 员 的 培训 得 分 存在 显著 差异 。 
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图 6-36 给 出 了 中 位 数 检验 相关 的 检验 统计 量 ， 从 中 可 以 看 


、 检验 统计 4 

出 ， 渐 近 显 著 性 为 0.002， 小 于 显著 性 水 平 。 故 拒绝 原 假设 ， 认 a 

为 三 组 销售 人 员 的 培训 得 分 存在 显著 差异 。 7 
图 6-37 给 出 了 约克 海尔 - 塔 帕 斯 特 拉 检 验 相关 的 检验 统计 自由 度 2 

量 ， 从 中 可 以 看 出 ， 渐 近 显著 性 为 0.000， 小 于 显著 性 水 平 。 故 。 _WERS 人 .000 

拒绝 原 假设 ， 认 为 三 组 销售 人 员 的 培训 得 分 存在 显著 差异 。 和 


一 般 来 说 ， 克 和 鲁 斯 卡尔 - 沃 利 斯 联检 验 用 于 检验 多 个 独立 样 a 
本 是 否 来 自 于 同一 个 总 体 ， 而 约克 海尔 - 塔 帕 斯 特 拉 和 中 位 数 检 组 
验 用 于 检验 多 个 独立 样本 来 自 的 不 同 总 体 是 否 具有 相同 的 分 布 。 图 6.35 克 重 斯 卡尔 - 活 利 斯 


本 例 建议 选择 约克 海尔 - 塔 帕 斯 特 拉 或 中 位 数 检验 方法 。 检验 统计 量 
检验 统计 2 
培训 考试 得 分 约克 海尔 - 塔 帕 斯 特 拉 检验 
个 家 让 0 培训 考试 得 分 
和 EE 销售 培训 组 中 的 级 别 数 3 
卡 方 12.400 个 案 数 60 
A 2 实测 JT 统计 898.000 
2 下 均值 统计 600000 
了 JT 统计 的 标准 其 73711 
b. 0 个 单元 格 (0.0%) 标准 JT 统计 4.043 
的 期 望 顷 率 低 于 5。 林 
期 望 的 最 抵 单 元 格 须 WR ll .000 《 双 尾 ) 000 
书 为 10.0。 a 分 组 交付 ;销售 培训 担 
图 6-36 ”中 位 数 检验 统计 量 图 6-37 约克 海尔 - 塔 帕 斯 特 拉 检 验 统计 量 


6.6 ”两 配对 样本 检验 


两 配对 样本 的 非 参 数 检验 又 称 为 双关 联 样本 检验 , 是 指 在 总 体 分 布 未 知 的 条 件 下 对 样本 来 
自 的 两 相关 配对 总 体 是 否 具有 显著 差异 进行 的 检验 。 所 谓 两 配对 样本 是 指 两 样本 具有 相同 或 相 
似 的 非 处 理 因素 。 


6.6.1 两 配对 样本 检验 的 基本 原理 


两 配对 样本 的 非 参 数 检验 一 般 用 于 对 配对 研究 对 象 给 予 不 同 处 理 并 进行 处 理 前 后 是 否 具 
有 显著 性 差异 的 分 析 。SPSS 提供 了 威 尔 科 克 森 、 符 号 、 麦 克 尼 马尔 和 边际 齐 性 4 种 检验 方法 
进行 两 配对 样本 的 检验 。 

(1) 符号 检验 

符号 检验 是 一 种 利用 正 、 负 号 的 数目 对 某 种 假设 作出 判定 的 非 参 数 检验 方法 。 符 号 检验 的 
基本 思路 是 , 将 第 二 组 样本 的 每 个 观测 值 减 去 第 一 个 样本 的 对 应 观测 值 , 观测 所 得 到 的 差 值 的 
符号 。 如 果 差 值 中 正 数 的 个 数 和 负数 的 个 数 差距 较 大 , 则 认为 两 样本 来 自 的 两 相关 配对 总 体 具 
有 显著 差异 。 
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(2 ) 威 尔 科 克 森 检验 

威 尔 科 克 森 检 验 是 一 种 扩展 的 符号 检验 。 其 基本 思路 是 , 如 果 两 样本 来 自 的 两 相关 配对 总 
体 没 有 显著 差异 的 话 , 不 但 差 值 中 正 数 的 个 数 和 负数 的 个 数 应 大 致 相等 , 而 且 正 值 和 负 值 的 秩 
和 也 大 致 相等 。 


(3 ) 麦克 尼 马 尔 检 验 

麦克 尼 马 尔 检验 的 思想 是 以 其 自身 为 对 照 , 进行 二 项 分 布 检验 。 其 通过 初始 的 观测 比率 和 
事后 的 观测 比率 的 变化 计算 二 项 分 布 的 概率 值 ,麦克 尼 马 尔 变化 显著 性 检验 要 求 数据 必须 为 两 
分 类 数据 。 


(4) 边际 齐 性 检验 
边际 齐 性 检验 是 麦克 尼 马 尔 变化 显著 性 检验 从 两 分 类 数据 向 多 分 类 数据 的 推广 ,通过 卡 方 
分 布 检 验 的 观测 比率 和 事后 的 观测 比率 的 变化 来 计算 。 


6.6.2 ”两 配对 样本 检验 的 SPSS 操作 


建立 或 打开 相应 的 数据 文件 后 ， 在 SPSS 中 便 可 以 进行 两 配对 样本 检验 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 ”|“2 个 相关 样本 ”命令 ,打开 
如 图 6-38 所 示 的 “双关 联 样 本 检验 ”对 话 框 。 

2) 选择 变量 。 

从 源 变量 列表 框 中 选择 要 进行 双关 联 样 本 检验 的 变量 ， 单 击 国 按 钮 使 之 选 入 “检验 对 ” 
列表 框 中 ， 如 图 6-39 所 示 。 变 量 必须 成 对 引入 ，SPSS 允许 引入 多 对 变量 ， 系 统 会 分 别 进行 
分 析 。 


检验 突 型 

司 成 T 科 吉大 QD 
目 符 8(S) 

站 坦克 尼 马 下 (0) 


了 Ji 性 由 | 
Ej Ac a 
图 6-38 “双关 联 样本 检验 ”对 话 框 图 6-39 ”双关 联 样本 检验 的 变量 选择 
3) 选择 检验 类 型 并 进行 精确 和 选项 的 设置 。 读者 可 以 参考 前 几 节 的 内 容 , 在 此 不 再 袭 述 。 
4) 分 析 结果 输出 。 


设置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 双关 联 样本 检验 
的 结果 。 


6.6.3 ”实验 操作 


下 面 将 以 数据 文件 “6-5” 为 例 ， 讲 解 双关 联 样本 检验 的 操作 。 
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1. 实验 数据 描述 


数据 文件 “6-5” 涉 及 在 标准 普尔 500 指数 上 列 出 的 各 支 技术 股 2000 年 的 股票 行情 ,利用 
数据 分 析 个 股 的 收益 与 市 场 收益 是 否 存在 系统 性 差异 。 本 实验 的 原始 数据 如 图 6-40 所 示 。 


| 
ma 
ED Fr = 
127 
pe B 5 了 下 区 8 有 可 
| 证券 名 称 远 劳 收 基 市 场 收益 
| 2_IAAPL -0.45 0.08 
| 3_ [Cpa 0.14 0.08 
| 4 DELL -0.28 0.08 
5 EMC v.14 0.08 
6 GTW -0.4 0.08 
| YT HP -0.32 0.08 
8 JITBI 0.06 0.08 
| 9 Lk v.29 0.08 
10 INCR 0.31 0.08 
NTAP 0.06 0.08 
12 PALK 0.5 0.08 
|13 | -0.16 0.08 
[14 UTS -0.06 0.08 
[1s| 
16 
这 


图 6-40 数据 文件 “6-5” 原 始 数据 


在 SPSS 变量 视图 中 建立 变量 “证 券 名 称 ”“ 证 券 收益 ”和 “市 场 收 益 ”， 分 别 表示 证 券 
代码 、2000 年 收益 和 市 场 平均 收益 ， 如 图 6-41 所 示 。 


生生 1] -0M SP55 Sratictics 各 号 尖 0 


ge 3 
| J] sw | Rm | mim 可 苦 | 便 | 避 失 | 列 ， 对齐 | 到 和 角色 | 
EEC IE 中 证 9 人 有 无 无 8 本 左 负 名 X 、 轨 入 
2 2000 生 中 渐 无 无 8 王 右 少 检 度 \ 坊 入 
| 市场 收益。 者 字 8 2 市 场 平均 收益 无 无 8 演 右 c 入 标 请 入 入 
1 


BM SPSS Stabstics 处 理 得 六 二 结 ] | 【Unicode ON 
图 6-41 数据 文件 “6-5” 的 变量 视图 


在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ， 输 入 完毕 后 部 分 数 
据 如 图 6-42 所 示 。 


2. 实验 的 操作 步骤 
实验 的 具体 操作 步骤 如 下 : 


GE56i) 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 |“2 个 相关 样本 ”命令 ， 打 开 
“双关 联 样本 检验 ”对 话 框 。 
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| 生 adHe 丰 检 窒 sav 生生 1] - BM SPSS Statistics 数 守 坟 禾 0o 
mE ma Fe em) WA Ho EP mg NR HR E00 Wed 


站 汪汪 
于 BRS 


[Bu SPSS Stabstcs 处 理 程 友 娄 绪 | |Unicode ON 
图 6-42 数据 文件 “6-5” 的 数据 视图 
(GE362 从 源 变量 列表 框 中 选择 “证 券 收益 ”和 “市 场 收益 ”变量 ， 单 击 国 按 钮 使 之 选 入 “ 检 
验 对 ”列表 框 中 。 
GE563 单 击 “ 选 项 ”按钮 ， 打 开 “ 双 关联 样本 : 选项 ”对 话 框 ， 选 中 “描述 ” 复 选 框 ， 单 
击 “继续 ”按钮 。 
GE563 在 “检验 类 型 ”选项 组 中 选中 “ 威 尔 科 克 森 ”和 “符号 ” 复 选 框 。 


3. 实验 结果 分 析 


单 击 “ 确 定 ”按钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 6-43~ 图 6-45 所 示 。 
图 6-43 给 出 了 两 个 变量 的 “个 案 数 ”“ 平 均值 ”“ 标 准 差 ”“ 最 小 值 ”和 “最 大 值 ” 描 
述 性 统计 量 。 
描述 统计 
个 案 数 。| 平均 值 | 标准 关 | 最 小 值 “| 最 大 估 
Noo 3 0144 .29563 -45 50 
市 场 平均 收 基 13 .0783 .00000 .08 08 


图 6-43 ”描述 性 统计 量 


图 6-44 给 出 了 威 尔 科 克 森 检验 相关 的 检验 统计 量 ， 从 中 可 以 看 出 ， 渐 近 显 著 性 为 0.311， 
大 于 显著 性 水 平 。 故 不 能 拒绝 原 假设 ， 认 为 个 股 收益 率 与 市 场 收益 率 无 系统 性 差异 。 

图 6-45 给 出 符号 检验 相关 的 检验 统计 量 ， 从 中 可 以 看 出 ， 精 确 显著 性 为 0.581， 大 于 显著 
性 水 平 。 故 不 能 拒绝 原 假设 ， 认 为 个 股 收益 率 与 市 场 收 益 率 无 系统 性 差异 。 

一 般 来 说 , 威 尔 科 克 森 检验 和 符号 检验 用 于 检验 两 个 配对 样本 是 否 来 自 于 相同 的 总 体 , 麦 
克 尼 马尔 检验 用 于 二 分 变量 的 检验 , 边际 齐 性 检验 用 于 定 序 变 量 的 检验 。 本 例 中 ， 由 于 样本 数 
量 的 限制 ， 系 统 无 法 进行 边际 齐 性 检验 和 麦克 尼 马 尔 检 验 , 根据 数据 类 型 ,使 用 威 尔 科 克 森 检 
验 和 符号 检验 。 
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a 
检验 统计 检验 统计 2 
000 年 可 市 场 下 均 收 基 


Er - 2000 年 收藏 


测 近 号 理性 《 双 尾 ) a11 精确 显著 往 《 双 必 ) 
a 睫 尔 科 克 看 符 号 六 检验 a. 符 号 检验 
b. 苦于 负 秩 。 b. 使 用 了 二 项 分 布 。 
图 6-44 威 尔 科 克 森 检验 统计 量 图 6-45 符号 检验 统计 量 


6.7 多 配对 样本 检验 


多 配对 样本 检验 用 于 在 总 体 分 布 未 知 的 情况 下 检验 多 个 相关 样本 是 否 来 自 于 相同 分 布 的 
总 体 。 


6.7.1 多 配对 样本 检验 的 基本 原理 


多 配对 样本 检验 的 基本 原理 与 两 配对 样本 相同 ,两 配对 样本 检验 是 多 配对 样本 检验 的 特殊 
情况 。SPSS 提供 了 伟 莱 德 曼 、 肯 德尔 W 和 柯 克 兰 Q 3 种 方法 进行 多 配对 样本 的 检验 。 


(1) 传 莱 德 曼 检验 

傅 莱 德 曼 检验 与 克 鲁 斯 卡尔 - 沃 利 斯 卫 检 验 的 思路 相似 , 傅 莱 德 曼 检验 还 考虑 到 区 组 的 影响 。 
其 首先 对 所 有 样本 合并 并 按 升 序 排列 ， 然 后 求 各 观测 量 在 各 自行 中 的 等 级 ， 并 对 各 组 样本 求 平均 
等 级 及 等 级 和 。 如 果 平均 等 级 或 等 级 和 相差 很 大 ， 则 认为 两 组 样本 所 属 的 总 体 有 显著 差异 。 


(2) 肯 德 尔 W 检验 

肯 德 尔 W 检验 的 思路 是 考察 多 次 评价 中 的 排序 是 否 随机 。 肯 德尔 W 检验 反应 了 各 行 数据 
的 相关 程度 。 如 果 其 取 值 接近 于 1， 则 认为 评价 中 的 排序 不 是 随机 的 ， 即 样本 来 自 的 多 个 配对 
总 体 的 分 布 存在 显著 差异 。 


(3 ) 柯 克 兰 Q 检验 
柯 克 兰 Q 检验 用 于 处 理 二 值 数据 ， 柯 克 兰 Q 统计 量 的 计算 如 公式 〈6-3) 所 示 。 


大 二 
KE-DY CN 一) 
=1 


2- 一 -于 -一 (6-3) 
KM -NM 
让 1 i=1 

其 中 ,表示 第 j 列 中 取 值 为 1 的 个 数 ，Mi 表 示 第 i 行 中 取 值 为 1 的 个 数 ，Q 统计 量 近似 


服从 于 卡 方 分 布 。 


6.7.2 ”多 配对 样本 检验 的 SPSS 操作 


建立 或 打开 相应 的 数据 文件 后 ， 便 可 以 在 SPSS 中 进行 多 配对 样本 检验 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 ”|“K 个 相关 样本 ”命令 ， 打 
开 如 图 6-46 所 示 的 “针对 多 个 相关 样本 的 检验 ”对 话 框 。 
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从 源 变 量 列表 框 中 选择 要 进行 多 配对 样本 检验 的 变量 ， 单 击 国 按 钮 使 之 选 入 “检验 变量 ” 


列表 框 中 ， 这 里 选择 “数学 ”“ 物 理 ” 和 “生物 ”。 


3) 进行 相应 的 设置 。 设 置 所 进行 的 检验 与 计算 显著 水 平 的 方法 。 


“统计 ”设置 


单 击 “ 统 计 ” 按 钮 ， 打 开 如 图 6-47 所 示 的 “多 个 相关 样本 : 统计 ”对 话 框 。 


卜 针对 地 个 但 关 样 本 的 检 喧 


2] 
久生 移 疆 税 


工 


忌 全 人 只) 站 人 和 Wt 站 可 兰 QIC) ] 
(EE 


6-46 “针对 多 个 相关 样本 的 检验 ”对 话 框 


图 6-47 


“多 个 相关 样本 : 统计 ”对 话 框 


该 对 话 框 用 于 设置 是 否 输出 描述 性 统计 量 和 四 分 位 数 。 与 前 几 节 中 不 同 , 多 配对 样本 检验 


中 无 须 处 理 缺 失 值 。 
4) 分 析 结果 输出 。 


设置 完毕 后 ， 单 击 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 多 配对 样本 检验 


的 结果 。 


6.7.3 ”实验 操作 


下 面 将 以 数据 文件 “6-6” 为 例 , 讲解 多 配对 样本 
检验 的 操作 。 

1. 实验 数据 描述 

数据 文件 “6-6” 是 三 门 不 同 课程 学 生得 分 的 数据 ， 
利用 多 配对 样本 检验 分 析 三 门 课程 得 分 是 否 存在 显 
著 差 异 ， 本 实验 的 原始 数据 如 图 6-48 所 示 。 

在 SPSS 的 变量 视图 中 ， 建 立 “ 数 学 ”“ 生 物 ” 
和 “物理 ”变量 ， 变 量 的 内 容 分 别 为 各 门 不 同 课程 的 
得 分 ， 如 图 6-49 所 示 。 

在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数 
据 输入 到 各 个 变量 中 ， 输 入 完毕 后 的 部 分 数据 如 图 
6-50 所 示 。 


6-48 数据 文件 “6-6” 原 始 数据 
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全 Sm cv 1 BM SPSS statistice EE = 
EC 


E 钨 瑟 Es 局 之 


BM SPSS Shabsics 处 浊 往 记 室 二 | Unicode ON 


6-49 ”数据 文件 “6-6” 的 变量 视图 


| 


图 6-50 数据 文件 “6-6” 的 数据 视图 


2. 实验 操作 步骤 

实验 的 具体 操作 步骤 如 下 : 

GE36i) 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 ”|“K 个 相关 样本 ”命令 ， 打 
开 “ 针 对 多 个 相关 样本 的 检验 ”对 话 框 。 

GES62 从 源 交 量 列表 框 中 选择 “数学 ”"“ 物 理 ” 和 “生物 ”变量 ， 单 击 国 按钮 使 之 先入“ 检 
验 变量 ”列表 框 中 。 

人 GE563 单 击 “ 统 计 ” 按 钮 ， 打 开 “ 多 个 相关 样本 : 统计 ”对 话 框 ， 选 中 “描述 ” 复 选 框 ， 
单 击 “ 继 续 ” 按 钮 。 

GES63 在 “检验 类 型 ”选项 组 中 ， 选 中 “ 肯 德 尔 W” 和 “ 傅 莱 德 曼 ” 复 选 框 。 


Et 日 
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3. 实验 结果 分 析 

单 击 “ 确 定 ” 按 钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 6-51~ 图 6-53 所 示 。 

图 6-51 给 出 了 两 个 变量 的 “个 案 数 ”“ 平 均值 ” “标准 差 ”“ 最 小 值 ” 和 “最 大 值 ” 描 
述 性 统计 量 。 


78.71 10.617 
79.83 10.833 
83.16 5.903 


6-51 ”描述 性 统计 量 


图 6-52 给 出 了 传 莱 德 曼 检验 相关 的 检验 统计 量 ， 从 中 可 以 看 出 ， 渐 近 显 著 性 为 0.002， 小 
于 显著 性 水 平 0.05。 故 拒绝 原 假设 ， 认 为 三 门 课 的 成 绩 具 有 系统 性 差异 。 
图 6-53 给 出 了 肯 德 尔 W 检验 相关 的 检验 统计 量 ， 从 中 可 以 看 出 ， 渐 近 显著 性 同样 为 


这 近 县 著作 
a. 傅 某 沥 县 检验 


6-52 ” 傅 莱 德 曼 检验 统计 量 图 6-53 肯 德 尔 W 检验 统计 量 


一 般 来 说 ， 伟 莱 德 曼 检验 用 于 检验 样本 是 否 来 自 于 同一 总 体 ， 肯 德尔 W 检验 用 于 检验 配 
对 样本 的 总 体 是 否 具有 相同 的 分 布 ， 柯 克 兰 Q 检验 用 于 二 分 变量 的 检验 。 本 例 中 ， 由 于 变量 
不 全 是 具有 相同 取 值 的 二 分 变量 ， 故 系统 无 法 进行 柯 克 兰 Q 检验 ， 结 合 本 例 的 研究 ， 建 议 使 
用 传 莱 德 曼 检验 。 


6.8 游程 检验 
游程 检验 用 于 检验 样本 的 随机 性 和 两 个 总 体 的 分 布 是 否 相同 。 
6.8.1 游程 检验 简介 


游程 检验 的 思路 是 将 连续 的 相同 取 值 的 记录 作为 一 个 游程 。 如 果 序 列 是 随机 序列 , 那么 游 
程 的 总 数 应 当 不 太 多 也 不 太 少 ,过 多 或 过 少 游程 的 出 现 均 可 以 认为 相应 变量 值 的 出 现 并 不 是 随 
机 的 。 


6.8.2 ”游程 检验 的 SPSS 操作 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 ”|“ 游 程 ”命令 ,打开 如 图 6-54 
所 示 的 “游程 检验 ”对 话 框 。 
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2) 选择 变量 。 

从 源 变量 列表 框 中 选择 要 进行 游程 检验 的 变量 ， 
单 击 国 按 钮 使 之 选 入 “检验 变量 列表 ”列表 框 中 。 

3) 进行 相应 的 设置 。 

“分 割 点 ”设置 

设置 分 类 的 标准 。“ 中 位 数 ”“ 众 数 ” 和 “平均 
值 3 个 复 选 框 分 别 表示 使 用 变量 的 中 位 数 、 众 数 和 平 
均值 作为 分 类 的 标准 ， 此 外 用 户 也 可 以 选择 “定制 ” 
并 在 其 后 的 文本 框 中 自 定义 分 类 标准 。 


“精确 ”与 “选项 ”设置 


x 
[Erm 
im) 


站 


[ 齐 抽 -一 
司 中 位 教 u 同 从 数 D) 
申 平 均值 6) 门 定制 (GG): 


“游程 检验 ”对 话 框 


图 6-54 


内 容 与 选项 含义 可 参考 6.2 节 的 卡 方 检验 ， 在 此 不 再 效 述 。 


4) 分 析 结 果 输 出 。 


设置 完毕 后 , 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 游程 检验 的 结果 。 


6.8.3 ”实验 操作 


下 面 将 以 数据 文件 “6-7” 为 例 ， 
1. 实验 数据 描述 


讲解 游程 检验 的 操作 。 


数据 文件 “6-7” 是 某 农场 不 同 地 块 某 种 农作物 产量 的 数据 ， 我 们 抽取 了 20 块 地 并 观察 其 
产量 ， 利 用 游程 检验 该 农场 观察 地 块 的 抽取 检查 是 否 是 随机 的 ， 本 实验 的 原始 数据 如 图 6-55 


所 示 。 


在 SPSS 的 变量 视图 中 建立 “产量 ”变量 ， 表 示 各 地 块 该 农作物 的 产量 ， 如 图 6-56 所 示 。 


起 aas cov 栈 名 1] - BM SpSS Statistics 条 有 棕 板 各 Er 
Bn aae ae ono wa one moon gg smart rR wog um 


EEF 本 了 蕊 因 
3 | - 导 
| 
十 |>| E 
电 
gsess | | 
a 


5 


数据 文件 “6-7” 的 原始 数据 


GM SPSS Stalshcs 站 进程 麻 负 结 | | Unicoge ON 


6-56 ”数据 文件 “6-7” 的 变量 视图 


在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 


数据 如 图 6-57 所 示 。 
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hs | NM SPSS Statistics RR 6 
hE EE 0 WD Em i NR 


加 
0 
加 
中 
1 
万 
7 
2 


CEE: 盾 : 


TB SPSS Stabstics 处 理 各 二 给 | |UnicodeON | 


6-57 ”数据 文件 “6-7” 的 数据 视图 


2. 实验 操作 步 又 

实验 的 具体 操作 步骤 如 下 : 

EEEDY 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”| “ 旧 对 话 框 ”| “游程 ” 命令， 打开“ 游程 
检验 ”对 话 框 。 

GET52 从 源 变量 列表 框 中 选择 “产量 ”变量 ， 单 击 国 按钮 使 之 选 入 “检验 变量 列表 ”列表 
框 中 。 

CED3 单 击 “选项” 按钮 在 “游程 : 选项 ”对 话 框 中 选中 “描述 ” 复 选 框 ， 单 击 “ 继 续 ” 
按钮 

EE” 在 “ 害 点 " 选项 组 中 选中 “平均 值 ” 复 选 框 。 

3. 实验 结果 分 析 


单 击 “ 确 定 ” 按 钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 6-58 和 图 6-59 所 示 。 

6-58 给 出 了 两 个 变量 的 个 案 数 、 平 均值 、 标 准 差 、 最 小 值 和 最 大 值 描述 性 统计 量 。 

图 6-59 给 出 了 相关 的 检验 统计 量 ， 从 中 可 以 看 出 ,渐进 显著 性 为 0.962， 大 于 显著 性 水 平 
0.05。 故 接受 原 假设 ， 认 为 从 该 农场 查看 产量 的 地 块 抽取 是 随机 的 。 


检验 信 ? 
个 家 数 < 位 验 人 
个 要 数 >= 检验 人 


总 个 案 数 
游程 数 


Zz 
评 近 县 著 性 《 双 尾 》 


产生 20 75.95 11.095 55 92 
图 6-58 ”描述 性 统计 量 图 6-59 检验 统计 量 
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单 样本 K-S 检验 用 于 检验 样本 是 否 来 自 于 特定 的 理论 分 布 。 
6.9.1 单 样本 K-S 检验 简介 


单 样本 K-S 检验 的 思路 是 将 样本 观察 值 的 分 布 和 定制 的 理论 分 布 进行 比较 ， 求 出 它们 之 
间 的 最 大 偏离 并 检验 这 种 偏离 是 否 是 偶然 的 。 如果 这 种 偏离 是 偶然 的 , 则 认为 样本 的 观察 结果 


来 自 所 定制 的 理论 分 布 总 体 。 


6.9.2 单 样本 K-S 检验 的 SPSS 操作 
建立 或 打开 相应 的 数据 文件 后 ， 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 进行 单 样本 K-S 


检验 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 ”|“ 单 样本 K-S” 命 令 ， 打 开 如 
图 6-60 所 示 的 “ 单 样本 柯 尔 莫 戈 洛 夫 -斯 米 诺 夫 检验 ”对 话 框 。 

2) 选择 变量 。 往生 本 柯 处 要义 洛 夫 - 所 洲 湛 夫 术 验 % 

从 源 变量 列表 框 中 选择 要 进行 单 样本 K-S 检 Se 
验 的 变量 , 单 击 国 按钮 使 之 选 入 “检验 变量 列表 ” 
列表 框 中 。 

3) 进行 相应 的 设置 。 凶 

“检验 分 布 ”设置 


该 选项 组 用 于 设置 指定 检验 的 分 布 类 型 的 -tess 


标准 ， 系 统 可 以 检验 正 态 分 布 、 均 匀 分 布 、 泊 松 了 瑟 中 口交 册 


© (Ee) 


分 布 和 指数 分 布 。 - OO 
4) 分 析 结果 输出。 EE 


设置 完毕 后 , 单 击 “ 确 定 ” 按 钮 , 即 可 在 SPSS 图 6-60 “ 单 样本 柯 尔 莫 戈 洛 夫 -斯 米 诺 夫 检验 ” 


Statistics 查看 器 窗口 得 到 单 样本 K-S 检验 的 结果 。 对 话 框 


6.9.3 ”实验 操作 
下 面 将 以 数据 文件 “6-8” 为 例 ， 讲 解 单 样本 K-S 检验 的 操作 。 
1. 实验 数据 描述 


数据 文件 “6-8” 是 某 工 艺 品 上 出 现 疣 点 的 数量 ， 我 们 抽取 了 50 件 产品 进行 观察 ， 
样本 K-S 检验 疯 点 的 分 布 是 否 服从 泊 松 分 布 ， 本 实验 的 原始 数据 如 图 6-61 所 示 。 


利用 单 


在 SPSS 的 变量 视图 中 建立 “站 点 ”变量 ， 表 示 工 艺 品 上 竟 点 的 数量 ， 如 图 6-62 所 示 。 
在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 


数据 如 图 6-63 所 示 。 
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站 es 区 say 下 巡 和 1]- 1M SPSS Statisics 孝 扣 各 = OO x 
文件 四 坊 醒 下) 和 看 QD 者 据 D) 转 热 中 分析) 让 清册 本 W(G) 实用 程 打 W) 扩 雪 XW) 亩 GD 帮助 td) 
T 上 :: 
到 
了 和 名称 交 型 丙 度 | 小 教 位 款 | 标 等 信 | 次 失 | 列 对 齐 | 列 重 | 角色 
4 | 2 闫 站 无 无 8 天 右 。 信 标 医生 入 
日 7 
7 3 
回 
是 
[| 
加 
加 了 
四 
上 
全 芒 副 | 
加 
和 
1 3 
图 | 
到 加 
回 | 
四 四 
具 T 
四 
加 
加 
加 TEN SPSS Stabstcs 外 理 各 机 统 | | Junicoqe ON| | 
图 6-61 数据 文件 “6-8” 原 始 数据 图 6-62 数据 文件 “6-8” 的 变量 视图 
榴 Ek Se 下 ov [加 雪 1 IBM SPSS Siatatics 次 天 二 .= 


图 6-63 数据 文件 “6-8” 的 数据 视图 


2. 实验 操作 步骤 


实验 的 具体 操作 步骤 如 下 : 

(ES6)， 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检验 ”|“ 旧 对 话 框 ”|“ 单 样本 K-S” 命 令 ， 打 开 
“ 单 样本 柯 尔 莫 戈 洛 夫 - 斯 米 详 夫 检验 ”对 话 框 。 

人 GE562 从 源 变量 列表 框 中 选择 “站 点 ”变量 ， 单 击 较 按 钮 使 之 选 入 “检验 变量 列表 ”列表 
框 中 。 

GES63 单 击 “ 选 项 ”按钮 ， 打 开 “ 单 样本 K-S: 选项 ”对 话 框 ， 选 中 “描述 ” 复 选 框 ， 单 

击 “ 继 续 ” 按 钮 。 

GE363 在 “检验 分 布 ”选项 组 中 选中 “ 泊 松 ” 复 选 框 。 
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3. 实验 结果 分 析 
SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 6-64 和 图 6-65 所 示 。 
单 样本 柯 尔 茧 戈 洛 夫 -斯 米 诺 
夫 检验 


个 案 数 50 


泊 松 参数 "… 。 平均 估 1.6800 
最 极 病 差 值 。 把 对 081 

正 081 

负 -.052 
柯 尔 莫 蕊 洛 大 -其 来 诺 炎 569 
汪 近 县 著 体 《 双 尾 ) 902 

a. 检验 分 布 为 泊 检 分 布 。 
1.6800 1.54444 半 b 根据 数据 计算 。 
6-64 ”描述 性 统计 量 6-65 检验 统计 量 


图 6-64 给 出 两 个 变量 的 个 案 数 、 平 均值 、 标 准 差 、 最 小 值 和 最 大 值 描述 性 统计 量 。 
图 6-65 给 出 相关 的 检验 统计 量 ， 从 中 可 以 看 出 ， 渐 进 显著 性 为 0.902， 大 于 显著 性 水 平 
0.05。 故 接受 原 假设 ， 认 为 此 工艺 品 的 瘟 点 分 布 服从 泊 松 分 布 。 


6.10 上 机 题 


视频 文件 ，\sample\ 上 机 题 \chap06\.… 


6.1 ”本题 调查 了 某 车 型 24 辆 车 的 耗 油 量 的 数据 ， 数 据 文件 如 下 表 所 示 〈 数 据 路 径 : 视频 
文件 \sample\ 上 机 题 \chap06\ 习 题 \ 第 6 章 第 一 题 .sav) 。 


耗 油 量 〈 升 / 百 公里 ) 耗 油 量 〈 升 / 百 公 里 ) 
9.8 9.7 
109 9.7 
9.9 10.3 
10.5 10.5 
9.6 99 
10.2 10.6 
9.8 9.6 
10.7 10.1 
10.4 103 
ul 99 
i12 9.6 
10.1 10.1 
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试 在 5% 显 著 性 水 平 下 ， 检 验 该 型 车 的 耗 油 量 是 否 服从 正 态 分 布 。 


6.2 本 题 给 出 了 某 种 产品 装 箱 重量 的 数据 ,调查 者 抽查 了 20 件 商品 , 建立 “编号 ”和 “ 重 
量 ” 两 个 变量 ， 数 据 文件 如 下 表 所 示 (数据 路 径 : 视频 文件 \sample\ 上 机 题 \chap06\ 习 题 \ 第 6 
章 第 二 题 .sav) 。 


重量 (kg) 
3.8 
3.7 
3.4 


试 在 5% 显 著 性 水 平 下 ， 检 验 该 产品 的 包装 重量 差异 是 否 是 随机 的 。 


6.3 某 工厂 使 用 两 台 机 床 加 工 零 件 ， 调 查 者 调查 了 两 台 机 床 加 工 的 零件 直径 ， 数 据 文件 
如 下 表 所 示 《〈 数 据 路 径 : 视频 文件 \sample\ 上 机 题 \chap06\ 习 题 \ 第 6 章 第 三 题 .sav) 。 


机 床 A 《cm) 机 床 B 《cm) 

1.04 1.08 
1.15 

1.86 1.9 
7 1.9 
LR2 ii 
1.14 1.2 
1.65 7 
1.92 1.86 
最 时 1.85 
1.76 1.78 


试 在 5% 显 著 性 水 平 下 ， 检 验 两 台 机 床 加 工 出 来 的 零件 是 否 存在 显著 差异 。 


6.4 某 工厂 改进 了 技术 ， 调 查 者 随机 抽取 了 15 名 工人 ， 调 查 他 们 在 工艺 改进 前 后 生产 
100 件 产品 的 时 间 ， 数 据 文件 如 下 表 所 示 〈 数 据 路 径 : 视频 文 件 \sample\ 上 机 题 \chap06\ 习 题 \ 
第 6 章 第 四 题 .sav) 。 


161 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


改进 前 〈 小 时 / 百 件 ) 改进 后 (小 时 / 百 件 ) 
70 48 
76 54 
58 60 
63 64 
63 48 
56 55 
58 54 
60 45 
65 51 
65 48 
75 56 
66 48 
56 64 
59 50 
70 54 


试 在 5% 显 著 性 水 平 下 ， 检 验 零 件 加 工时 间 是 否 显著 减少 。 


6.S ”随机 抛 一 枚 硬币 ， 记 录 正 反面 出 现 的 顺序 ， 出 现 正 面 时 我 们 记 作 “1”， 出 现 反面 时 
我 们 记 作 “0”， 数 据 文件 如 下 表 所 示 数据 路 径 : 视频 文件 \sample\ 上 机 题 \chap06\ 习 题 \ 第 6 
章 第 五 题 .sav) 。 


序号 结果 结果 


-ii-|lol-|-|lolocloc|l-|ocloc|l-|lolo|l-|- 
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( 续 表 ) 
结果 


总 
clol-lel- lel- | le le le |- |- 


试 在 5% 显 著 性 水 平 下 ， 检 验 硬币 正 反面 的 出 现 是 否 服从 二 项 分 布 。 


6.6 某 市 环保 局 负责 对 十 个 监测 点 的 空气 质量 进行 检测 ， 现 在 采用 新 方法 对 总 悬浮 颗粒 
物 进行 测量 , 空气 中 总 悬浮 颗粒 物 的 含量 分 布 未 知 (数据 路 径 : 视频 文件 sample\ 上 机 题 \chap06\ 
习题 \ 第 6 章 第 六 题 .sav) 。 


序号 老 方法 〈%) 新 方法 〈%) 
和 3.46 3.47 
2 2.18 2.29 
3 5.34 5.04 
4 9.15 9.35 
5 1.13 0.98 
6 51.34 50.28 
7 213 22.59 
8 4.35 4.08 
9 0.02 0.01 
10 5.62 5.28 


试 在 5% 显 著 性 水 平 下 ， 检 验 新 旧 方 法 是 否 存在 显著 差异 。 


6.7 某 社区 医院 在 查 体 中 对 40 名 居民 的 血清 总 胆固醇 含量 进行 了 测量 , 测量 数据 如 下 表 
所 示 〈 数 据 路 径 : 视频 文件 \sample\ 上 机 题 \chap06\ 习 题 \ 第 6 章 第 七 题 .sav) 。 
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血清 总 胆固醇 二 | 血清 总 胆固醇 
序号 序号 
(mmol/L) (mmol/L) 
4.76 21 4.78 
2 3.36 22 5.12 
3 6.13 23 5 
4 3.94 24 5.09 
5 3.55 25 4.69 
6 4.22 26 4.73 
7 4.30 27 3.50 
8 4.70 28 4.37 
a 5.68 29 4.88 
10 4.55 30 6.24 
11 4.37 31 5.31 
12 5.38 32 4.49 
13 6.29 33 4.62 
14 
15 
16 
ya 
18 
好 
20 


试 在 5% 显 著 性 水 平 下 ， 检 验 该 社区 居民 的 血清 胆固醇 含量 是 否 服从 指数 分 布 。 


6.8 某 市 进行 公务 员 公开 招考 ， 面 试 的 考试 分 为 三 个 分 组 ， 由 不 同 的 面试 组 专家 进行 面 
试 ， 各 组 考生 的 面试 得 分 如 下 表 所 示 〈 数 据 路 径 ， 视频 文件 \sample\ 上 机 题 \chap06\ 习 题 \ 第 6 
章 第 八 题 .sav) 。 


分 组 一 分 组 二 分 组 = 
4.76 6.29 4.73 
3.36 5.20 3.50 
6.13 7.21 4.37 
3.94 S$.53 4.88 
3.55 3.92 6.24 
4.22 5.20 5.3 
4.30 5.17 4.49 
4.70 5.76 4.62 
5.68 4.78 3.60 
4.55 $.12 4.44 
4.37 SS 4.42 
5.38 5.09 4.03 
4.08 4.69 5.84 


试 在 5% 显 著 性 水 平 下 ， 检 验 该 三 组 面试 专家 的 打分 有 无 显著 差异 。 
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方差 分 析 是 一 种 假设 检验 , 它 把 观测 总 变异 的 平方 和 与 自由 度 分 解 为 对 应 不 同 变 异 来 源 的 
平方 和 与 自由 度 , 将 某 种 控制 性 因素 所 导致 的 系统 性 误差 和 其 他 随机 性 误差 进行 对 比 ,从 而 推 
断 各 组 样本 之 间 是 否 存在 显著 性 差异 , 以 分 析 该 因素 是 否 对 总 体 存在 显著 性 影响 。 方差 分 析 法 
采用 离 差 平 方 和 对 变 差 进行 度量 ， 从 总 离 差 平方 和 分 解 出 可 追溯 到 指定 来 源 的 部 分 离 差 平方 
和 。 方 差分 析 要 求 样本 满足 以 下 条 件 : 


(1) 可 比 性 。 资 料 中 各 组 均 数 本 身 必须 具有 可 比 性 ， 这 是 方差 分 析 的 前 提 。 

(2) 正 态 性 。 方 差分 析 要 求 样本 来 源 于 正 态 分 布 总 体 ， 偏 态 分 布 资 料 不 适用 方差 分 析 。 
对 偏 态 分 布 的 资料 应 考虑 用 对 数 变换 、 平 方 根 变换 、 倒 数 变换 、 平 方 根 反正 弦 变 换 等 变量 变换 
方法 变 为 正 态 或 接近 正 态 后 再 进行 方差 分 析 。 

(3) 方差 齐 性 。 方 差分 析 要 求 各 组 间 具 有 相同 的 方差 ， 即 满足 方差 齐 性 。 

方差 分 析 在 经 济 学 、 管 理学 、 医 学 、 心 理学 和 生物 学 等 方面 具有 广泛 的 应 用 ，SPSS 也 提 
供 了 强大 的 方差 分 析 功 能 ， 本 章 将 对 几 种 常用 的 方差 分 析 的 SPSS 实现 过 程 进行 介绍 。 


7.1 单 因 素 方差 分 析 
单 因素 方差 分 析 用 于 分 析 单 一 控制 变量 影响 下 的 多 组 样本 的 均值 是 否 存在 显著 性 差异 。 


7.1.1 单 因素 方差 分 析 的 原理 


单 因素 方差 分 析 也 称 为 一 维 方差 分 析 , 用 于 分 析 单 个 控制 因素 取 不 同 水 平时 因 变 量 的 均值 
是 否 存在 显著 差异 。 单 因素 方差 分 析 基 于 各 观测 量 来 自 于 相互 独立 的 正 态 样本 和 控制 变量 不 同 
水 平 的 分 组 之 间 的 方差 相等 的 假设 。 单 因素 方差 分 析 将 所 有 的 方差 划分 为 可 以 由 该 因素 解释 的 
系统 性 偏差 部 分 和 无 法 由 该 因素 解释 的 随机 性 偏差 , 如 果 系 统 性 偏差 明显 超过 随机 性 偏差 , 则 
认为 该 控制 因素 取 不 同 水 平时 因 变 量 的 均值 存在 显著 差异 。 


7.1.2 ” 单 因素 方差 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 单 因 素 方差 分 析 。 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 比 较 平均 值 ”|“ 单 因素 ANOVA 检验 ”命令 ， 打 开 如 图 
7-1 所 示 的 “ 单 因素 ANOVA 检验 ”对 话 框 。 

2) 选择 变量 。 

从 源 变 量 列表 框 中 选择 需要 进行 方差 分 析 的 因 变量 ， 然 后 单 击 国 按 钮 将 选中 的 变量 选 入 
“ 因 变量 列表 ”列表 框 中 ， 选 择 因 子 变量 ， 并 将 其 选 入 “因子 ”列表 框 中 。 
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。 “ 因 变 量 列表 ”列表 框 : 该 列表 框 中 的 变量 为 要 进行 方差 分 析 的 目标 变量 ， 称 为 因 变 量 ， 
因 变 量 一 般 为 度量 变量 ， 类 型 为 数值 型 。 
e “因子 ”列表 框 : 该 列表 框 中 的 变量 为 因子 变量 ， 又 称 自 变量 ， 主 要 用 来 分 组 。 如 果 要 比 
较 两 种 教学 方法 下 学 生 的 数学 成 绩 是 否 一 致 ， 则 数学 成 绩 变 量 就 是 因 变量 ， 教 学 方法 就 是 
因子 变量 。 自 变量 为 分 类 变量 ， 其 取 值 可 以 为 数字 ， 也 可 以 为 字符 串 。 因 子 变量 值 应 为 整 
数 ， 并 且 为 有 限 个 类 别 。 

“ 亩 产量 ”应 选 入 “ 因 变 量 列表 ”列表 框 中 ,， “施肥 类 型 ”为 因子 ， 选 入 “因子 ”列表 杠 

中 ， 如 图 7-2 所 示 。 


筷 单 因素 ANOVA 检验 起 站 四 素 ANOVA 检 验 


疯 后 肥 类 型 吨 Ie= 芭 ] 


图 7-1 “ 单 因素 ANOVA 检验 ”对 话 框 7-2 ” 单 因素 方差 分 析 的 变量 选择 
3) 进行 相应 的 设置 。 i 
“对 比 ” 设 置 oa) suo: BE 
单 击 “ 对 比 ” 按 钮 , 弹出 如 图 7-3 所 示 的 “ 单 因素 ANOVA 一 一 一 一 一 


检验 : 对 比 ” 对 话 框 。 

Q@@ “多 项 式 ” 复 选 框 。 该 复 选 框 用 于 对 组 间 平 方 和 划分 成 
趋势 成 分 ， 或 者 指定 先 验 对 比 ， 按 因子 顺序 进行 趋势 分 析 。 一 
旦 用 户 选中 “多 项 式 ” 复 选 框 ， 则 “等 级 ”下 拉 列 表 框 就 会 被 
激活 ， 然 后 就 可 以 对 趋势 分 析 指 定 多 项 式 的 形式 ， 如 “线性 ” 
“二 次 项 ”“ 立 方 ”“ 四 次 项 ”“ 五 次 项 ”。 

@ “系数” 文本 框 。 该 文本 框 用 于 对 组 间 平 均 数 进行 比较 
定制 ， 即 指定 的 用 t 统计 量 检验 的 先 验 对 比 。 为 因子 变量 的 每 、 图 73 “ 单 因素 ANOVA 检验 : 
个 组 (类别 ) 输入 一 个 系数 ， 每 次 输入 后 单 击 “ 添 加 ”按钮 ， 对 比 ” 对 话 杠 
每 个 新 值 都 添加 到 系数 列表 框 的 底部 。 要 指定 其 他 对 比 组 ,可 单 击 “ 下 一 页 ”按钮 。 利用 “下 
一 页 ”和 “上 一 页 ”按钮 在 各 组 对 比 间 移 动 。 系 数 的 顺序 很 重要 ， 因 为 该 顺序 与 因子 变量 类 别 
值 的 升序 相对 应 。 列 表 框 中 的 第 一 个 系数 与 因子 变量 的 最 低 组 值 相 对 应 , 而 最 后 一 个 系数 与 最 
高 值 相 对 应 。 

“事后 比较 ”设置 

单 击 “事后 比较 ”按钮 ， 弹 出 如 图 7-4 所 示 的 “ 单 因素 ANOVA 检验 : 事后 多 重 比较 ”对 话 框 。 

GD “假定 等 方差 ”选项 组 。 该 选项 组 主要 用 于 在 假定 等 方差 下 进行 两 两 范围 检验 和 成 对 
多 重 比较 ， 共 有 14 种 检验 方法 ， 如 表 7-1 所 示 。 
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起 曲 因 素 ANOVA 检验 : 事后 S 重 到 洲 


本 加 50 开局 将) 
二 QO) 加 下 


古井 黑 尼 T2QW) 可 开局 特 T3 站 关 产 吉尔) 站 邓 尼 村 CD) 
PtP 
EPE 


图 7-4 “ 单 因素 ANOVA 检验 : 事后 多 重 比较 ”对 话 框 
表 7-1 假定 方差 齐 性 下 两 两 范围 检验 的 检验 方法 


方法 简介 

Ls 最 小 显著 性 差异 法 ， 主 要 使 用 t 检验 对 组 均值 之 间 的 所 有 成 对 比较 ， 检 验 敏感 度 较 高 ， 
对 多 个 比较 的 误差 率 不 做 调整 

拜 弗 伦 尼 修正 LSD 方 法 ， 同 样 是 使 用 t 检验 在 组 均值 之 间 进行 成 对 比较 ， 但 通过 将 每 次 检验 的 错 
误 率 设置 为 实验 性 质 的 错误 率 除 以 检验 总 数 来 控制 总 体 误差 率 

斯 达 克 基于 t 统计 量 的 成 对 多 重 比 较 检验 ， 可 以 调整 多 重 比 较 的 显著 性 水 平 ， 相 对 于 修正 LSD 
方法 提供 更 严密 的 边界 

雪 费 使 用 F 取样 分 布 ， 为 均值 所 有 可 能 的 成 对 组 合 进行 并 发 的 联合 成 对 比较 ， 可 用 来 检查 组 


均值 的 所 有 可 能 的 线性 组 合 ， 而 非 仅 限于 成 对 组 合 ， 但 该 方法 敏感 度 不 高 


R-E-G-WF 基于 F 检验 的 Ryan-Einot-Gabriel-Welsch 多 步 进 过 程 
R-E-G-W Q 基于 T 极 差 的 Ryan-Einot-Gabriel-Welsch 多 步 进 过 程 
使 用 T 范 围 分 布 在 均值 之 间 进 行 所 有 成 对 比较 ， 同 时 使 用 步 进 式 过 程 比较 具有 相同 样本 大 


A 小 的 同类 子 集 内 的 均值 对 。 均 值 按 从 高 到 低 排序 ， 首 先 检验 极端 的 差分 值 


使 用 T 范 围 统计 量 进行 组 间 所 有 成 对 比较 ， 并 将 实验 误差 率 设置 为 所 有 成 对 比较 的 集合 误 

差 率 

图 基 s-b 使 用 T 范 围 分 布 在 组 之 间 进 行 成 对 比较 

用 与 Student-Newman-Keuls 检 验 所 使 用 的 完全 一 样 的 逐步 顺序 成 对 比较 ， 但 为 单个 检验 的 
错误 率 设置 保护 水 平 

加 布 里 埃 尔 。 | 使 用 学 生化 最 大 模 数 的 成 对 比较 检验 ， 并 且 当 单元 格 大 小 不 相等 时 ， 它 通常 比 圭 赫 伯 格 


GT2 更 为 强大 ， 但 当 单元 大 小 变化 过 大 时 ， 加 布 里 埃 尔 检验 可 能 会 变 得 随意 


霍 赫 伯 格 GT2 | 使 用 学 生化 最 大 模 数 的 多 重 比 较 和 范围 检验 ， 与 图 基 真 实 显著 性 差异 检验 相似 


沃 勒 邓肯 基于 统 计 的 多 比较 检验 , 使 用 Bayesian 方 法 ， 需 要 在 输入 框 中 指定 类 型 与 类 型 I 的 误差 比 


将 一 组 处 理 与 单个 控制 均值 进行 比较 的 成 对 多 重 比较 t 检验 ， 在 “检验 ”中 选择 检验 方 
法 : “ 双 侧 ”， 检 验 任何 水 平 〈 除 了 控制 类 别 外 ) 的 因子 的 均值 是 否 不 等 于 控制 类 别 的 均 
值 ; “< 控制 ”， 检 验 任何 水 平 的 因子 的 均值 是 否 小 于 控制 类 别 的 均值 ，“> 控 制 ”， 检 
验 任何 水 平 的 因子 的 均值 是 否 大 于 控制 类 别 的 均值 


这 14 种 假定 等 方差 下 的 两 两 范围 检验 和 成 对 多 重 比较 检验 方法 中 ， 比 较 常 用 的 是 邦 弗 伦 尼 、 


邓 尼 特 
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@@“ 不 假定 等 方差 ”选项 组 。 该 选项 组 主要 用 于 在 不 假定 等 方差 下 进行 两 两 范围 检验 和 成 
对 多 重 比较 ， 选 项 组 中 含有 4 个 复 选 框 : 


。 塔 姆 黑 尼 T2， 选 中 该 复 选 框 ， 表 示 输 出 基于 t 检验 的 保守 成 对 比较 结果 。 

。 邓 尼 特 T3， 选 中 该 复 选 框 ， 表 示 执 行 学 生化 最 大 值 模 数 的 成 对 比较 检验 。 

。 。 盖 姆 斯 - 豪 厄 尔 ， 选 中 该 复 选 框 ， 表 示 执 行 方差 不 齐 的 成 对 比较 检验 ， 且 该 方法 比较 常用 。 

。 ” 邓 尼 特 C， 选 中 该 复 选 框 ， 表示 执行 基于 学 生化 范围 的 成 对 比较 检验 。 

@@“ 显 著 性 水 平 ” 文 本 框 。 该 文本 框 用 于 指定 两 两 范围 检 筷 e 四 更 ANOVAH; .。 X 
验 和 成 对 多 重 比较 检验 的 显著 水 平 ， 输 入 范围 是 0.01 一 0.99， | 
系统 默认 为 0.05。 问 固定 和 秆 机 效应 吕 ) 

口 访 关机) 

“选项 ”设置 ee 

单 击 “ 选 项 ”按钮 , 弹出 如 图 7-5 所 示 的 “ 单 因素 ANOVA 于 
检验 : 选项 ”对 话 框 。 pr 

@ “统计 ”选项 组 。 该 选项 组 主要 用 于 指定 输出 的 统计 El 
量 ， 包 括 : [EE La La ] 


© 


描述 : 表示 要 输出 每 个 因 变 量 的 个 案 数 、 平 均值 标准 差 、 图 7-5 “ 单 因素 ANOVA 检验 : 
均值 标准 误差 、 最 小 值 、 最 大 值 和 95% 置 信 区 间 。 选项 ”对 话 框 
固定 和 随机 效应 : 表示 把 数据 看 作 面 板 数 据 进行 回归 ， 以 计算 固定 效应 模型 的 标准 差 、 标 
准 误 和 95% 置 信 区 间 ， 以 及 随机 效应 模型 的 标准 误 、95% 置 信 区 间 和 成 分 间 方 差 估 计 。 
方差 齐 性 检验 : 即 莱 文 方差 齐 性 检验 。 

布朗 - 福 塞 斯 : 表示 计算 布朗 - 福 塞 斯 统计 量 以 检验 组 均值 是 否 相等 ， 特 别 是 当 莱 文 方差 齐 
性 检验 显示 方差 不 等 时 ， 该 统计 量 优 于 下 统计 量 。 

韦 尔 奇 : 计算 Welch 统计 量 以 检验 组 均值 是 否 相等 ， 与 布朗 - 福 塞 斯 类 似 ， 当 莱 文 方差 齐 
性 检验 显示 方差 不 等 时 ， 该 统计 量 优 于 下 统计 量 。 


“缺失 值 ” 选 项 组 。 该 选项 组 主要 用 于 当 检 验 多 个 变量 ， 有 一 个 或 多 个 变量 的 数据 缺 


失 时 ， 可 以 指定 检验 剔除 哪些 个 案 ， 有 两 种 方法 : 


@ 


按 具体 分 析 排除 个 案 : 表示 给 定 分 析 中 的 因 变 量 或 因子 变量 有 缺失 值 的 个 案 不 用 于 该 分 
析 ， 也 不 使 用 超出 因子 变量 指定 范围 的 个 案 。 

成 列 排除 个 案 : 表示 因子 变量 有 缺失 值 的 个 案 ， 或 者 在 主 对 话 框 “ 因 变量 列表 ”列表 框 中 
缺失 的 个 案 都 排除 在 所 有 分 析 之 外 。 如 果 尚 未 指定 多 个 因 变 量 ， 那 么 这 个 选项 不 起 作用 。 


“平均 值 图 ” 复 选 框 。 该 复 选 框 用 于 绘制 每 组 的 因 变量 平均 值 分 布 图 ， 组 别 是 根据 因 


子 变 量 控制 的 。 
设置 完毕 后 ， 单 击 “ 继 续 ” 按 钮 ， 返 回 到 “ 单 因 素 ANOVA 检验 ”对 话 框 。 


4) 


分 析 结 果 输 出 


单 击 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 单 因素 方差 分 析 的 结果 。 
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下 面 将 以 “7-1” 数 据 文件 为 例 ， 讲 解 单 因素 方差 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 
1. 实验 数据 描述 
“7-1” 数 据 文件 是 某 农 业 大 学 对 使 用 不 同 肥料 的 实验 对 比 数据 ， 对 同一 种 作物 的 不 同 实 


验 田 分 别 施用 普通 钾肥 、 控 释 肥 和 复合 肥 并 观测 产量 。 下 面 将 利用 单 因素 方差 分 析 来 分 析 不 同 
的 施肥 量 对 亩 产 的 影响 ， 本 实验 的 原始 数据 如 图 7-6 所 示 。 


977.00 复合 肥 
938.00 复合 肥 


7-6 ”数据 文件 “7-1” 原 始 数据 


在 SPSS 的 变量 视图 中 建立 变量 “产量 ”和 “施肥 类 型 ”， 分 别 表示 实验 田产 量 和 实验 田 
的 施肥 类 型 。“ 施 肥 类 型 ”变量 中 分 别 用 “1、2、3” 人 代表“ 普通 钾肥 、 控 释 肥 、 复 合肥 ”， 
如 图 7-7 所 示 。 


本 加 条 方 芝 分 奸 sav 鞠 旭 和 1] -IBM 5p55 Statistics 相生 必要 2 


a | | 列 | 到 | 角色 
商量 无 无 8 沽 右 少 # 度 入 加 入 
EX 开 无 无 6 。 对 右 山名 X 全 入 


[ER 


图 7-7 数据 文件 “7-1” 的 变量 视图 
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在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 , 输入 完毕 后 的 部 分 


数据 如 图 7-8 所 示 。 
为 间 因 未 方 差分 析 sav 随 宅 生 1] - BM SPSS Statistics 数 富 而 想 著 车 口 x 
文人 四 坟 久 全 二 看 WW) 才 提 Dj 转机 [DD 分析 册 下 光山 ENG 实惠 厅 U， 六 村 00。 计 DD 部 io) 
one 
和 :2813 量 
FF Er 
1 54.00 100 
2 75 00 100 
3 89100 100 
4 373.00 100 
5 300 100 
日 ‘59.00 100 
了 92100 200 
a 400 200 
SR 三 996 00 200 
0 92900 200 
Es 3 97300 200 
位 36300 200 
3 %200 300 
1 100 300 
| 985 00 300 
Er 


BM SPSS Saistcs 处 于 和 让 攻 | | JUnicode ON 


图 7-8 数据 文件 “7-1” 的 数据 视图 


2. 实验 操作 步骤 

实验 的 具体 操作 步骤 如 下 : 

ES36i) 在 菜单 栏 中 选择 “分 析 ”| “比较 平均 值 ”| “ 单 因素 ANOVA 检验 ”命令 , 打开 “ 单 
因素 ANOVA 检验 ”对 话 框 。 

ES362 将 “ 讶 产量 ” 选 入“ 因 变 量 列表 ”列表 框 中 ; 将 “施肥 类 型 ” 选 入 “因子 ”列表 框 中 。 

(GE363 单 击 “ 选 项 ”按钮 ， 打 开 “ 单 因素 ANOVA 检验 : 选项 ”对 话 框 ， 选 中 “方差 齐 性 
检验 ”“ 平 均值 图 ” 复 选 框 ， 然 后 单 击 “继续 ”按钮 ， 保 存 设置 结果 。 

(于 4 单 击 “ 事 后 比较 ”按钮 ， 打 开 “ 单 因素 ANOVA 检验 : 事后 多 重 比较 ”对 话 框 ， 选 

中 “ 邦 弗 伦 尼 ” 复 选 框 ， 单 击 “ 继 续 ” 按 钮 。 

GE565 单 击 “对 比 ” 按 钮 ， 打 开 “ 单 因素 ANOVA 检验 : 对 比 ”对 话 框 ， 选 中 “多 项 式 ” 
复 选 框 ， 并 将 “等 级 ” 设 为 “线性 ”， 单 击 “继续 ”按钮 。 

6 而 706 单 击 “ 确 定 ” 按 钮 ， 输 出 分 析 结果 。 


3. 实验 结果 及 分 析 
SPSS Statistics 查 看 器 窗口 的 输出 结果 如 图 7-9~ 图 等 方差 检验 

ei ee 自由 度 1 ”自由 度 2 显著 性 
图 7-9 给 出 了 等 方 性 检验 的 结果 ， 从 中 可 以 看 出 , 莱 一 080 


文 方差 齐 性 检验 的 显著 性 为 0.08， 大 于 显著 水 平 0.05， 
此 基本 可 以 认为 样本 数据 之 间 的 方差 是 齐 次 的 。 图 7-9 等 方差 检验 

图 7-10 给 出 了 单 因 素 方差 分 析 的 结果 ， 从 中 可 以 看 出 ， 组 间 平 方 和 是 28254、 组 内 平方 
和 是 5877， 其 中 组 间 平 方 和 的 下 值 为 36.058， 显 著 性 是 0.000， 小 于 显著 水 平 0.05， 因 此 我 们 
认为 不 同 的 施肥 类 型 对 亩 产量 有 显著 的 影响 。 另外 , 这 个 表 中 也 给 出 了 线性 形式 的 趋势 检验 结 
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果 ， 组 间 变 异 被 施肥 类 型 所 能 解释 对比) 的 部 分 是 23585.333， 被 其 他 因素 解释 〈 偏 差 ) 的 
有 4669.444， 并 且 组 间 变 异 被 施肥 类 型 所 能 解释 的 部 分 是 非常 显著 的 。 


ANOVA 
亩 产生 
平方 和 自由 度 约 方 攻 显著 性 
共同 《组合 ) 28254.778 2 14127.389 36.058 .000 
城 性 页 “对比 ”23585333 1 23585.333 60.197 .000 
偏差 4669.444 1 4669 444 11.918 .004 
组 由 5877.000 15 391.800 
总 计 34131.778 17 


图 7-10 单 因 素 方差 分 析 
图 7-11 给 出 了 多 重 比 较 的 结果 ，* 表 示 该 组 均值 差 是 显著 的 。 因此， 从 中 可 以 看 出 ,第 一 
组 和 第 二 组 、 第 三 组 的 亩 产量 均值 差 是 非常 明显 的 , 但 是 第 二 组 与 第 三 组 的 亩 产量 均值 差 却 不 
是 很 明显 。 另 外 ， 还 可 以 得 到 每 组 之 间 均 值 差 的 标准 误差 、 置 信 区 间 等 信息 。 


多 重 比较 
因 变 剑 南 产 熏 
印 旨 他 尼 
下 二 全 生生 下 95% 置信 区 同 
四 施肥 和 芮 型 (J) 沪 肥 类 型 ) 标准 误差 显 千 件 FR 上 中 
100 200 -78.50000” 1142804 000 -1092841 -477159 
300 -96.66667” 11 42804 000 -119.4508 -57 8825 
200 100 78.50000” 1142604 000 。 477159 1092841 
300 -1016667 1142804 1.000 -40.9508 206175 
3.00 100 88.66667” 1142804 .000 。 57.8825 1194508 
200 1016667 1142804 1.000 -206175 409508 


“. 竺 均值 差 值 的 电车 性 水 竹 为 0.05。 
图 7-11 多 重 比 较 结果 


图 7-12 给 出 了 各 组 的 均值 图 。 从 图 中 可 以 清楚 地 看 到 不 同 的 施肥 类 型 对 应 的 不 同 的 亩 产 
量 均 值 。 可 见 ， 第 一 组 的 亩 产 最 低 ， 且 与 其 他 两 组 的 亩 产 均 值 相 差 较 大 ， 而 第 二 组 和 第 三 组 之 
间 的 亩 产 均值 差异 不 大 ， 这 个 结果 和 多 重 比较 的 结果 非常 一 致 。 


平均 值 疼 


wsoo| 


启动 
8 
3 3 


得 
3 


so0| 


1 2%0 3 
施肥 天 型 


7-12 平均 值 图 
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7.2 ”多 因素 方差 分 析 


多 因素 方差 分 析 用 于 分 析 两 个 或 两 个 以 上 因素 是 否 对 不 同 水 平 下 样本 的 均值 产生 显著 的 
影响 。 


多 因素 方差 分 析 的 原理 


多 因素 方差 分 析 用 于 分 析 两 个 或 两 个 以 上 控制 变量 影响 下 的 多 组 样本 的 均值 是 否 存在 显 
著 性 差异 。 多 因素 方差 分 析 不 但 可 以 分 析 单 个 因素 对 因 变 量 的 影响 , 也 可 以 对 因素 之 间 的 交互 
作用 进行 分 析 ， 还 可 以 进行 协 方差 分 析 。 


2 


多 因素 方差 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 


中 进行 单 因 变量 的 多 因素 方差 分 析 。 CE 
1) 在 菜单 栏 中 选择 “分 析 ”| “一般 线性 模型 ”| 。 | gm 国 一 贰 四 
“ 单 变量 ”命令 ， 打 开 如 图 7-13 所 示 的 “ 单 变量 ”对 |? wemmem | 
话 框 。 AL 人 
2) 选择 变量 。 | SS 
对 话 框 中 有 5 个 列表 框 , 包括 ( 协 变量 的 分 析 此 处 hao 
不 做 深入 介绍 ， 将 在 本 章 第 四 节 中 讨论 ) : -nm 
目标 变量 。“ 因 变量 ”列表 框 中 只 能 选择 唯一 一 
个 变量 。 图 7-13 “ 单 变量 ”对 话 框 


2 


固定 因子 : 该 列表 框 中 的 变量 为 固定 控制 变量 ， 主 要 用 来 分 组 。 固 定 控制 变量 的 各 个 水 平 
一 般 是 可 以 人 为 控制 的 ， 如 实验 的 温度 、 水 分 等 。 因 子 自 变 量 为 分 类 变量 ， 其 取 值 可 以 为 
数字 ， 也 可 以 为 字符 串 。 因 子 变量 值 应 为 整数 ， 并 且 为 有 限 个 类 别 。 

随机 因子 : 该 列表 框 中 的 变量 为 随机 控制 变量 ， 也 用 来 分 组 。 与 固定 控制 变量 不 同 的 是 ， 
随机 控制 变量 的 各 个 水 平一 般 是 不 可 以 人 为 控制 的 ， 如 体重 、 身 高 等 。 

协 变量 : 该 列表 框 中 的 变量 是 与 因 变量 相关 的 定量 变量 ， 用 来 控制 与 因子 变量 有 关 且 影响 
方差 分 析 的 目标 变量 的 其 他 干扰 因素 ， 类 似 于 回归 分 析 中 的 控制 变量 。 

WLS 权重 : 该 列表 框 为 加 权 最 小 二 乘 分 析 指 定 权重 变量 。 如 果 加 权 变 量 的 值 为 0、 负 数 
或 缺失 ， 则 将 该 个 案 从 分 析 中 排除 。 已 用 在 模型 中 的 变量 不 能 用 作 加 权 变 量 。 


将 图 7-13 中 的 变量 选 入 上 述 列表 框 中 ， 结 果 如 图 7-14 所 示 。 

3) 进行 相应 的 设置 。 

“模型 ”设置 

单 击 “ 模 型 ”按钮 ， 弹 出 如 图 7-15 所 示 的 “ 单 变量 : 模型 ”对 话 框 。 
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x 


+» 
| 
加 
国 
E33 下 下 方 () 人 闪避 网 在 模型 中 包括 寺中 
ET 到 E 天 [Em ENE 
图 7-14 多 因素 方差 分 析 变 量 选择 图 7-15 “ 单 变量 : 模型 ”对 话 框 


Q@ “指定 模型 ”选项 组 。 在 该 选项 组 中 为 单 因 变量 多 因素 分 析 指 定 方差 分 析 的 模型 ， 有 
两 种 : 一 是 “全 因子 ”， 即 全 因子 模型 ， 包 含 所 有 因子 主 效应 、 所 有 协 变量 主 效应 及 所 有 因子 
间 交 互 ,不 包含 协 变量 交互 ; 二 是 “定制 ”， 表示 可 以 仅 指定 其 中 一 部 分 的 交互 或 指定 因子 协 
变量 交互 ， 必 须 指定 要 包含 在 模型 中 的 所 有 项 。 

一 旦 选中 “定制 ” 单 选 按钮 ， 下 方 的 “因子 与 协 变量 ”“ 构 建 项 ”“ 模 型 ”项 均 被 激活 。 
“因子 与 协 变量 ”列表 框 中 列 出 了 所 有 参与 分 析 的 因子 与 协 变量 。“ 构 建 项 ”的 “类 型 ”下 拉 
列表 框 中 有 5 种 模型 形式 可 供 选 择 : 


。 “交互 ”， 表 示 模 型 中 含有 所 选 变 量 的 交互 项 ; 

。 “ 主 效应 ”， 表 示 模 型 中 仅 考 虑 各 个 控制 变量 的 主 效应 而 不 考虑 变量 之 间 的 交互 项 ; 

。 “所 有 二 阶 ”“ 所 有 三 阶 ”“ 所 有 四 阶 ”， 表 示 模 型 中 要 考虑 所 有 二 维 、 三 维 、 四 维 的 交 
互 效应 。 

加 “平方 和 ”下 拉 列 表 框 。 该 下 拉 列 表 框 用 于 指定 计算 平方 和 的 方法 ， 主 要 有 4 种 类 型 ; 

。 “ 工 类 ”， 表 示 分 层 处 理 平方 和 ， 仅 处 理 主 效应 项 ; 

。 “ 开 类 ”， 表 示 处 理 所 有 其 他 效应 ; 


“II 类 ”， 表 示 可 以 处 理 I 类 和 开 类 中 的 所 有 效应 ; 
“IV 类 ”， 表 示 对 任何 效应 都 处 理 ， 但 对 于 没有 缺失 单元 的 平衡 或 非 平 衡 模型 ，III 类 平 
方 和 方法 最 常用 ， 也 是 系统 默认 的 。 
@@ “在 模型 中 包含 截 距 ” 复 选 框 。 该 复 选 框 用 于 决定 是 否 在 模型 中 包含 截 距 ， 如 果 认 为 数 
据 回 归 线 可 以 经 过 坐标 轴 原 点 的 话 ， 就 可 以 在 模型 中 不 含 截 距 , 但 是 一 般 系统 默认 含有 截 距 项 。 
“对 比 ” 设 置 
单 击 “ 对 比 ”按钮 ， 弹 出 如 图 7-16 所 示 的 “ 单 变量 : 对 比 ”对 话 框 。 
Q@ “因子 ”列表 框 。 该 列表 框 用 于 存放 多 因素 方差 分 析 中 的 因子 变量 ， 选 择 需 要 对 比 的 
因子 就 可 以 激活 “更 改 对 比 ”选项 组 ， 可 对 要 进行 对 比 的 因子 设置 对 比方 式 。 
@@ “更 改 对 比 ”选项 组 。 该 选项 组 主要 用 于 检验 因子 水 平 之 间 的 差 值 ， 可 以 为 模型 中 的 
每 个 因子 指定 对 比 ， 包 括 7 种 对 比方 法 : 
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。 无 ， 表 示 不 进行 因子 各 个 水 平 间 的 任何 对 比 ; 

偏差 ， 表 示 对 因子 变量 每 个 水 平 与 总 平均 值 进行 对 比 ; 

简单 ， 表 示 对 因子 变量 各 个 水 平 与 第 一 个 水 平和 最 后 一 个 水 平 的 均值 进行 对 比 ; 

差 值 ， 表 示 对 因子 变量 的 各 个 水 平 都 与 前 一 个 水 平 进 行 做 差 比 较 ， 第 一 个 水 平 除外 ; 

Helmert， 表 示 对 因子 变量 的 各 个 水 平 都 与 后 面 的 水 平 进行 做 差 比较 ， 最 后 一 个 水 平 除外 ; 

重复 ， 表 示 重 复 比 较 ， 除 第 一 类 之 外 ， 因 素 变 量 的 每 个 分 类 都 与 后 面 所 有 分 类 的 平均 效应 

进行 比较 ; 

e 多 项 式 ， 表 示 对 每 个 水 平 按 因 子 顺 序 进行 趋势 分 析 。 对 于 “偏差 ”和 “简单 ”对 比 ， 可 以 
选择 参照 水 平 是 “最 后 一 个 ”或 “第 一 个 ”。 


“图 ” 设 

el oe 按钮 ， 弹 出 如 图 7-17 所 示 的 “ 单 变量 : 轮廓 图 ”对 话 框 。 
蛤 单 变量: 对 比 x 
四 7 加: 


图 7-16 “ 单 变 量 : 对 比 ” 对 话 框 图 7-17 “ 单 变 量 : 轮廓 图 ”对 话 杠 


“因子 ”列表 框 : 该 列表 框 中 主要 存放 各 个 因子 变量 。 
“水 平 轴 ”列表 框 : 从 “因子 ”列表 框 中 选 入 ，“ 水 平 轴 ”列表 框 中 的 变量 是 均 数 轮廓 图 
中 的 横 坐 标 。 

。 “单独 的 线条 ”列表 框 : 从 “因子 ”列表 框 中 选 入 ， 用 来 绘制 分 离线 的 。 

e “单独 的 图 ”列表 框 : 从 “因子 ”列表 框 中 选 入 ， 用 来 创建 分 离 图 。 

当 “ 水 平 轴 ”“ 单 独 的 线条 ”或 “单独 的 图 ”列表 框 中 有 变量 时 ， 下 方 的 “添加 ”“ 更 改 ” 
“除去 ”按钮 就 会 被 激活 ， 单 击 “ 添 加 ”按钮 即 可 将 选择 的 变量 加 入 “图 ”列表 框 。 

“事后 比较 ”设置 

单 击 “ 事 后 比较 ”按钮 ， 弹 出 如 图 7-18 所 示 的 “ 单 变量 : 实测 平均 值 的 事后 多 重 比较 ” 

“ 单 变 量 : 实测 平均 值 的 事后 多 重 比较 ”对 话 框 的 作用 在 于 一 旦 确定 均值 间 存 在 差 值 ， 两 两 
范围 检验 和 成 对 多 重 比较 就 可 以 确定 哪些 均值 存在 差 值 ， 同 样 包含 假定 等 方差 和 不 假定 等 方差 两 
种 ， 与 单 因素 方差 分 析 中 的 “假定 等 方差 ”和 “不 假定 等 方差 ”选项 组 相同 ， 此 处 不 再 重复 。 

“保存 ”设置 

单 击 “ 保 存 ” 按 钮 ， 弹 出 如 图 7-19 所 示 的 “ 单 变 量 : 保存 ”对 话 框 。 
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“ 单 变量 : 保存 ”对 话 框 主要 用 于 在 数据 编辑 器 中 将 模型 预测 的 值 、 残 差 和 相关 测量 另存 
为 新 变量 ， 包 括 4 个 选项 组 。 
QD “预测 值 ”选项 组 。 该 选项 组 用 于 保存 模型 为 每 个 个 案 预 测 的 值 ， 含 有 3 个 复 选 框 : 


。 “未 标准 化 ”， 表 示 模 型 为 因 变量 预测 的 值 ; 
。 加 权 ， 表 示 加 权 未 标准 化 预测 值 ， 仅 在 已 经 选择 了 WLS 变量 的 情况 下 可 用 ; 
。 标准 误差 表示 对 于 自 变量 具有 相同 值 的 个 案 所 对 应 的 因 变量 均值 标准 差 的 估计 。 


起 单 冯 量 : 实测 二 均值 的 事后 多 重 比 太 x EP Es x 
祯 则 人 残 差 一 
ET]| 口 示 标准 化 QM) 
[| 国 infRIS 
门 标 E 器 差 中 站 标准 化 向) 
回 学 生化 G) 
一 一 
口 口 员 DD) 


国 REcw2 因 加 市 里 过 /hh(G; 时 双人 NZ) © < 扶 制 0] © > 1 


不 假定 等 方差 
国 已 屿 内 尼 T2400 图 对 尼 林 T3 国 兰 坝 术 友 后 个 国光 局 性 CQJ 


CE 
图 7-18 “ 单 变量 : 实测 平均 值 的 事后 多 重 比较 ”对 话 框 图 7-19 “ 单 变量 : 保存 ”对 话 框 
@@ “ 残 差 ”选项 组 。 该 选项 组 用 于 保存 模型 的 残 差 ， 含 有 5 个 复 选 框 : 


未 标准 化 ， 表 示 因 变量 的 实际 值 减 去 由 模型 预测 的 值 ; 
加 权 ， 表 示 在 选择 了 WLS 变量 时 提供 加 权 的 未 标准 化 残 差 ; 
标准 化 ， 表 示 对 残 差 进行 标准 化 的 值 ; 

学 生化 ， 表 示 Student 化 的 残 差 ; 

删除 后 ， 表 示 剔 除 残 差 。 


@ “诊断 ”选项 组 。 该 选项 组 用 于 标识 自 变量 的 值 具有 不 寻常 组 合 的 个 案 和 可 能 对 模型 
产生 很 大 影响 的 个 案 的 测量 ， 包 括 两 个 复 选 框 : 


。 库 克 距离 ,表示 在 特定 个 案 从 回归 系数 的 计算 中 排除 的 情况 下 ， 所 有 个 案 残 差 变 化 幅度 的 
测量 , 较 大 的 库 克 距离 表明 从 回归 统计 量 的 计算 中 排除 个 案 之 后 , 系数 会 发 生根 本 变化 。 

。 杠杆 值 ， 表 示 未 居中 的 杠杆 值 ， 每 个 观察 值 对 模型 拟 合 的 相对 影响 。 

@ “系数 统计 ”选项 组 。 该 选项 组 用 于 保存 模型 中 的 参数 估计 值 的 协 方差 矩阵 ， 一 旦 选 

中 “创建 系数 统计 ” 复 选 框 ， 下 面 两 个 单 选 按钮 就 会 被 激活 : 

。 创建 新 数据 集 ， 表 示 将 参数 估计 值 的 协 方差 矩阵 写 入 当前 会 话 中 的 新 数据 集 ; 

。 写 入 新 数据 文件 ， 表 示 将 参数 估计 值 的 协 方 差 矩 阵 写 入 外 部 SPSS Statistics 数据 文件 。 其 
中 ,对 于 每 个 因 变 量 ,都 有 一 行 参数 估计 值 、 一 行 与 参数 估计 值 对 应 的 t 统计 量 的 显著 性 
值 及 一 行 残 差 自由 度 。 
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“选项 ”设置 


单 击 “ 选 项 ”按钮 , 弹出 如 图 7-20 所 示 的 “ 单 


变量 : 选项 ”对 话 框 。 


该 对 话 框 提供 一 些 基 于 固定 效应 模型 计算 的 


统计 量 ， 包 括 : 


@ “因子 与 因子 交互 ”列表 框 。 该 列表 框 中 
是 所 有 因子 变量 和 “OVERALL” 变 量 ， 从 中 选择 
变量 并 单 击 箭头 按钮 就 可 以 使 之 选 入 "显示 下 列 各 “| = 
项 的 平均 值 ”列表 框 中 。 

@ “显示 下 列 各 项 的 平均 值 ”列表 框 。 该 列 | 口 xag@ 门 开国 @) 
表 框 中 的 变量 用 来 输出 该 变量 的 估算 边际 均值 、 标 。 | 合生 # 什 中 四 类 WO 
准 误差 等 统计 量 。 当 该 列表 框 中 含有 变量 时 ， 下 方 
“比较 主 效 应 ” 复 选 框 就 会 被 激活 ， 该 复 选 框 表示 
为 模型 中 的 任何 主 效应 提供 估计 边际 均值 未 修正 


显示 下 史 肯 项 的 平均 值 (W): 


中 扬 述 统计 (D) 
加 效应 里 估算 (E) 


已 对 比 系 款 托 哮 (Q) 癌 一 般 避 信函 于 (G) 


显著 性 水 平 W); 1.05 | 置信 区 间 为 95.0% 


的 成 对 比较 ， 但 必须 在 “显示 下 列 各 项 的 平均 值 ” 图 7-20 “ 单 变量 : 选项 ”对 话 框 
列表 框 中 含有 主 效应 变量 。 
@@ “显示 ”选项 组 。 该 选项 组 主要 用 于 指定 输出 的 统计 量 ， 有 10 个 复 选 框 ， 其 功能 如 表 


7-2 所 示 。 
表 7-2 “显示 ”选项 组 中 各 复 选 框 的 功能 
选项 功能 
描述 统计 因 变量 的 平均 值 、 标 准 差 和 计数 
齐 性 检验 输出 进行 方差 齐 性 的 莱 文 检验 
效应 量 估算 输出 每 个 功效 和 参数 估计 值 的 偏 eta 方 值 
分 布 -水 平 图 输出 不 同 水 平 因 变 量 均值 对 标准 差 和 方差 的 图 
实测 寡 输出 功效 显著 的 Alpha 值 ， 系 统 默认 的 显著 水 平 为 0.05 
残 差 图 输出 模型 残 差 图 
参数 估算 值 输出 参数 估计 值 、 标 准 误差 、t 检 验 、 置 信 区 间 和 检验 效能 
失 拟 检查 因 变量 和 自 变量 之 间 的 关系 是 否 能 由 模型 充分 地 描述 
对 比 系数 矩阵 输出 对 比 系数 I 矩阵 
一 般 可 估 函 数 进行 基于 常规 可 估计 函数 构造 定制 的 假设 检验 


由“ 显著 性 水 平 ” 文 本 框 。 该 文本 框 主要 用 于 指定 上 述 统计 量 的 显著 水 平 。 


4) 分 析 结 果 输 出 


设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 单 因 变 量 多 因素 


方差 分 析 的 结果 。 


7.2.3 ”实验 操作 


下 面 将 以 数据 文件 “7-2” 为 例 ， 讲 解 多 因素 方差 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 
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1. 实验 数据 的 描述 


数据 文件 “7-2” 是 某 种 果汁 在 不 同 地 区 的 销售 数据 ， 调 查 人 员 统 计 了 易 拉 缸 包装 和 玻璃 
瓶 包装 的 饮料 在 三 个 地 区 的 销售 金额 。 下 面 利用 多 因素 方差 分 析 方法 分 析 销 售 地 区 和 包装 方式 
对 销售 金额 的 影响 ， 本 实验 的 原始 数据 如 图 7-21 所 示 。 


5% 
Aial ED 下 
K28 
日 到 5 E F 5 H 1 
1 | 包 净 销售 地 区 “镇 售 额 (万 元 ) 
2 琉璃 瓶 地 区 A 41633 
3 玻 瑚 瓶 地 区 A 38324 
4 玻璃 产 地 区 日 57721 
5 玻璃 洲 地 区 日 43645 
6 玻璃 痊 。 。 地 区 A 34164 
了 玻璃 六 ”地 区 日 34827 
日 易 拉 外 地 区 A 18462 
9_ 玻 坊 痊 地 区 日 29728 
10 玻 形 闫 地 区 日 29744 
11 玻璃 瓶 地 区 A 296 36 
12 玻 现 瓶 。 。 地 区 A 36169 
13 琉璃 频 。 ”地 区 A 44126 
14 玻 玉 瓶 ”地 区 A 40113 
15 易 拉 店 地 区 日 33480 
16 玻 瑚 并 地 区 日 37945 
17 易 拉 怨 地 区 C 27637 
但 玻 玉 产 “地 区 C 38457 
19 易 拉 握 地 区 B 34625 
20 1 易 拉 谎 地 区 C 50321 


图 7-21 数据 文件 “7-2” 的 原始 数据 


在 SPSS 的 变量 视图 中 建立 变量 “包装 ”“ 销 售 地 区 ”和 “销售 额 ”， 分 别 表 示 饮 料 的 包装 、 
不 同 的 销售 地 区 和 销售 额 。 其 中 ，“ 销 售 地 区 ”变量 中 分 别 用 “1、2、3 ”代表 “地 区 A、 地 
B、 地 区 C”，“ 包 装 ” 变 量 中 分 别 用 “0、1” 代 表 “ 易 拉 缸 、 玻 璃 瓶 ”， 如 图 7-22 所 示 。 


| 起 多 办 康 万 二 分 析 sev 区 提 全 1] -18M SPSS Statistics 煞 志 中 口 x 


区 


[|_| s% | a 司 | 

包装 数字 包装 形式 。 位, 易 拉 湛 ) 。 无 性 右 依 村 度 入 给 入 
销售 地 区 雪 字 购物 地 区 {1, 地 区 蚀 。 无 王 右 iP 标 度 给 入 
销售 新 。 元 字 销售 匡 ”无 无 漠 右 信行 度 入 输入 


TEN SPSS Statistics 处 理 程序 外 绪 | | [unicodeON | | | 


7-22 ”数据 文件 “7-2” 的 变量 视图 
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在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 
数据 如 图 7-23 所 示 。 


者 多 因 录 万 三 分析 .sav [天 自 和 1] -18M SPSS Statistics 基 插 相生 器 一 口 x 


全 


[ TEN SPSS Siavstics 地 时 程序 吉 纵 | Unicode ON | T 


7-23 ”数据 文件 “7-2” 的 数据 视图 


2. 实验 操作 步骤 

实验 的 具体 操作 步骤 如 下 : 

ES6i) 在 菜单 栏 中 选择 “分 析 ”|“ 一 般 线性 模型 ”| “ 单 变量 ”命令 ， 打 开 “ 单 变量 ”对 
话 框 。 

(GE562 将 “销售 额 ” 选 入 “ 因 变 量 ” 列 表 框 ， 将 “包装 形式 ”和 “销售 地 区 ”变量 选 入 “ 固 
定 因子 ”列表 框 。 


GES63 单 击 “ 模 型 ” 按钮， 弹出 “ 单 变量 : 模型 ”对 话 框 ， 选 中 “全 因子 ” 单 选 按钮 ， 其 
他 为 默认 ， 然 后 单 击 “继续 ”按钮 保存 设置 结果 。 
人 GE363 单 击 “选项 ”按钮 ， 弹 出 “ 单 变 量 : 选项 ”对 话 框 ， 选 中 “ 齐 性 检验 ”“ 描 述 统计 ” 


“分 布 -水 平 图 ” 复 选 框 ， 单 击 “继续 ”按钮 。 主体 间 因 子 
GE5065 单 击 “确定 ”按钮 ， 输 出 分 析 结果 。 I 
3 实验 结果 及 分 析 包装 形式 0 易 拉 垦 185 
1 玻璃 瓶 166 
SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 7-24~ 图 7-29 WE 1 地 KEA 70 
EN 让 地 区 B 222 
所 未 3 地 区 C 59 


图 7-24 给 出 了 主要 的 因子 列表 ， 从 中 可 以 看 出 ,两 个 因 
子 变量 的 各 个 水 平 及 每 个 水 平 上 的 观测 值 数目 。 图 7-24 主体 问 因子 

图 7-25 给 出 了 因 变 量 在 各 个 因素 下 的 一 些 描述 性 统计 量 ， 从 中 可 以 看 出 ， 不 同 包装 形式 
和 销售 地 区 的 销售 额 的 平均 值 、 标 准 编 差 及 个 案 数 。 
图 7-26 给 出 了 因 变 量 在 各 个 因素 水 平 下 的 误差 方差 的 菜 文 检验 结果 ， 从 中 可 以 看 出 ， 检 
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验 的 零 假设 是 在 所 有 组 中 因 变 量 的 误差 方差 均 相 等 ， 显 著 性 是 0.330， 大 于 显著 性 水 平 0.05 
或 0.10， 因 此 可 以 认为 因 变量 在 各 个 因素 水 平 下 的 误差 方差 相等 。 


描述 统计 
国 变量 ， 销售 额 
包装 形式 购物 地 区 玫 均 值 标准 偏 莽 个 案 数 
RE 。 地 RA 413.0657 90.86574 35 
地 RB 2 440.9647 98.23860 120 
地 RC 407.7747 69.33334 30 
总 计 4303043 93.47877 185 
博大 版 。 地 A 343.9763 100.47207 35 误差 方差 的 莱 文 等 同性 检验 ? 
地 RB 361.7205 90.46076 102 六 
地 RC 405.7269 90.57058 29 
rn 1 F 自由 度 1 ”自由 度 2 是 著 性 
总 计 ”3656671 92.64058 166 | 
总 计 地 RA 378.5210 101.25839 70 J 5 让 
JERB 404.5552 102.48440 222 生计: 帮 全 个 直 的 全 下 是 可 十 方 村 放生 这- 天 
地 RC 4067681 74.42114 59 和 
总 计 3997352 。 98.40821 351 销售 地 区 
图 7-25 ”描述 性 统计 量 7-26 误差 方差 的 莱 文 等 同性 检验 


图 7-27 给 出 了 主体 间 效 应 检验 结果 ， 从 中 可 以 看 出 ， 整 个 模型 的 F 统 计量 为 11.092， 显 著 
性 是 0.000， 可 见 此 方差 分 析 模型 是 非常 显著 的 ， 但 是 R 方 只 有 0.138， 说 明 销 售 额 的 变异 能 被 
“包装 ”“ 销 售 地 区 ”及 两 者 的 交互 效应 解释 的 部 分 仅 有 13.8%。 其 中 ，“ 包 装 ”“ 包 装 * 销 
售 地 区 ”对 销售 额 有 显著 的 影响 (相应 的 显著 性 都 小 于 0.05〉， 但 “销售 地 区 ”对 销售 额 却 没 
有 显著 的 影响 。 


主体 疗效 应 检验 

因 变 各: 销售 上 额 

源 川 美 平方 和 自由 度 灼 方 F 县 车 性 
修正 模型 469402.9962 5 93880.599 11.092 000 
截 距 39359636.39 1 39359636.39 4650.274 000 
_ 包装 158037.442 1 158037.442 18.672 000 
销售 地 区 33506.210 2 16753.105 1.979 .140 
包 台 “博信 夸 区 ”69858.325 2 34929163 4127 017 
误差 2920058.824 345 8463.939 

总 计 59475118.44 351 

修正 后 总 计 3389461.820 350 


a.R 方 =.138《 调 整 后 RR 方 = .126) 
图 7-27 主体 间 效 应 检验 


7-28 给 出 了 销售 额 关 于 标准 差额 的 分 布 和 水 平 图 。 该 图 绘制 了 标准 差 对 各 个 水 平 上 均值 
的 分 布 图 ， 来 源 于 图 7-25 中 描述 性 统计 量 的 平均 值 和 标准 偏差 。 从 该 图 中 可 以 看 出 ， 各 个 水 平 
均值 下 的 标准 差 并 没有 递增 或 递减 的 趋势 ， 进 一 步 验证 了 图 7-26 误差 方差 的 莱 文 检验 结果 。 

图 7-29 给 出 了 销售 额 在 各 个 因素 水 平 下 的 估算 边际 均值 ， 该 图 是 以 包装 方式 为 分 线 对 销 
售 地 区 的 边际 均 图 ， 并 根据 图 7-25 中 的 平均 值 所 绘制 。 从 该 图 中 可 以 看 出 ， 易 拉 缸 和 玻璃 瓶 
两 个 水 平 并 没有 交叉 ， 说 明 包装 方式 对 销售 额 的 影响 十 分 显著 ， 这 与 图 7-27 中 对 “包装 ”的 
分 析 结 果 具 有 一 致 性 。 
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销售 额 的 分 布 -水 二 图 销售 额 的 分 布 -水 平 图 
S ao 
Fs . 分 o 
pe 布 soo0- 
区 分 
芭 
so 
om 
T r T T r T T 
本 mm Em EE A Em Ee] mm 下 im 
水 平 《 平 均值 7 水 平 〈 平 均值 》 
提包 拔 " 销 人 地 区 二 但 吏 * 销 售 区 
图 7-28 消费 额 的 分 布 和 水 平 图 图 7-29 消费 额 的 估算 边际 均值 


7.3 协 方差 分 析 


某 些 情况 下 ,在 进行 方差 分 析 的 过 程 中 部 分 变量 的 水 平 难以 进行 人 为 控制 。 针 对 这 种 情况 ， 
统计 学 家 创建 了 协 方差 分 析 方 法 ， 即 先 利用 线性 回归 剔除 干扰 因素 后 再 进行 方差 分 析 。 


7.3.1 协 方差 分 析 的 原理 


协 方差 分 析 的 基本 思想 是 将 难以 人 为 控制 的 因素 作为 协 变量 , 首先 通过 线性 回归 方法 消除 
干扰 因素 的 影响 ， 然 后 进行 方差 分 析 。 协 方差 分 析 中 认为 因 变量 的 变化 受 4 个 因素 的 影响 ， 即 
控制 变量 的 独立 与 交互 作用 、 协 变量 的 作用 和 随机 因素 的 作用 , 协 方差 分 析 在 消除 了 协 变量 的 
影响 后 再 分 析 控 制 变量 对 观测 变量 的 作用 。 


7.3.2 协 方差 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 协 方差 分 析 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 一 般 线性 模型 ”|“ 单 变量 ”命令 ， 打 开 如 图 7-30 所 示 的 
“ 单 变量 ”对 话 框 。 

2) 选择 变量 。 

从 源 变量 列表 框 中 选择 需要 进行 协 方差 分 析 的 因 变 量 ， 单 击 箭头 按钮 将 选中 的 变量 选 入 
“ 因 变 量 ” 列 表 框 中 ; 然后 依次 选 入 “固定 因子 ”变量 、“ 随 机 因子 ”变量 、“ 协 变量 ”变量 ， 
如 图 7-31 所 示 。 

“ 因 变量 ”“ 固 定 因子 ”“ 随 机 因子 ”“ 协 变量 ”“WLS 权重 ”列表 框 的 功能 和 用 法 与 
多 因素 方差 分 析 相 同 ， 此 处 不 再 痪 述 ， 读 者 可 以 参考 相关 章节 。 

3) 进行 相应 的 设置 。 

“ 单 变量 ”对 话 框 中 的 “模型 ” “对 比 ”“ 图 ”“ 事 后 比较 ”“ 保 存 ”“ 选 项 ”的 具体 设 
置 方法 与 多 因素 方差 分 析 相同 ， 此 处 不 再 资 述 。 
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重生 x 明 #=a 
AO): 
2 本 ar: 
国 Ear 
a En| 
Emma 
国 [Bue 
国 | |] 
| 国志 二 一 
[9 
图 7-30 “ 单 变量 ”对 话 框 图 7-31 协 方差 分 析 变 量 选 择 
4) 分 析 结果 输出 。 


设置 完毕 后 , 单 击 “ 确 定 ” 按 钮 , 即 可 在 SPSS Statistics 查看 器 窗口 得 到 协 方 差分 析 的 结果 。 


7.3.3 ”实验 操作 


下 面 将 以 数据 文件 “7-3” 为 例 ， 讲 解 协 方差 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 

1. 实验 数据 描述 

数据 文件 “7-3” 是 对 3 个 小 组 采用 不 同 的 培训 方法 进行 培训 前 后 的 测试 得 分 数据 。 尽 管 
研究 的 是 3 种 培训 方法 对 学 员 成 绩 的 影响 ， 但 是 学 员 培 训 后 的 成 绩 不 仅 与 相应 的 培训 方法 有 


关 , 而 且 受 到 自身 条 件 的 影响 ,因此 必须 考虑 培训 前 学 员 的 得 分 情况 。 下 面 将 利用 协 方差 分 析 
方法 对 该 数据 文件 进行 分 析 ， 本 实验 的 原始 数据 如 图 7-32 所 示 。 


a a el 2 CE 


ele [slelelelelsl=| | 


全 


ESEEEEE 


日 


7-32 ”数据 文件 “7-3” 原 始 数据 
在 SPSS 的 变量 视图 中 建立 变量 “培训 组 ”“ 培 训 后 得 分 ”和 “培训 前 得 分 ”， 分 别 表示 
销售 人 员 所 在 的 培训 组 和 培训 前 后 的 得 分 ， 如 图 7-33 所 示 。 
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起 二 六 世人 析 say 区 大 和 1]- BM SPSS Statistics 要 局 = 人 


有 1 1 无 8 洗 右 少林 度 ~\ 疡 入 
[CT 二 襄阳 分 “无 要 右 依 林 度 v 才 入 
六 训 前 得分 数字 8 培训 前 刘 分 “无 EAL 


[By SPSS Statsbics 外 理 程序 儿 绪 | 。 |Unicode ON 
图 7-33 数据 文件 “7-3” 的 变量 视图 
在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ， 输 入 完毕 后 的 部 分 


数据 如 图 7-34 所 示 。 
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起 ' 协 方 检 分 析 sav 莉 入 1] -IBM SPSS Staristics 攻 吕 可 本 o x 
文件 吉本) 可 看 0 并 损 D) 二 执 中 分析 WW) EERE(G) 天 用 得 扩展 0 盏 DC。 大 


图 7-34 数据 文件 “7-3” 的 数据 视图 


2. 实验 操作 步骤 

实验 的 具体 操作 步骤 如 下 : 

6 本 07 在 菜单 栏 中 选择 “分 析 ”|“ 一 般 线性 模型 ”| “ 单 变量 ”命令 ， 打 开 “ 单 变量 ”对 
话 框 。 


ES62 将 “培训 后 得 分 ” 选 入 “ 因 变 量 ”列表 框 ， 将 “培训 组 ” 选 入 “固定 因子 ”列表 框 ; 
将 “培训 前 得 分 ” 选 入 “ 协 变量 ”列表 框 。 

GES63 单 击 “ 模 型 ”按钮 ， 弹 出 “ 单 变量 : 模型 ”对 话 框 ， 选 中 “全 因子 ” 单 选 按钮 ， 其 
他 为 默认 ， 单 击 “ 继 续 ” 按 钮 。 
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人 GE564 单 击 “选项 ”按钮 ， 弹 出 “ 单 变量 : 选项 ”对 话 框 ， 选 中 “描述 统计 ” 复 选 框 ， 然 
后 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 结果 。 


G5705 单 击 “确定 ”按钮 ， 输 出 分 析 结果 。 时 册 
因 变 集 : 培训 后 得 分 
3. 实验 结果 及 分 析 阅 训 组 王 均 值 标准 偏差 个 案 数 
"| 63.5798 13.50858 20 
SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 7-35 和 图 > 73.5677 10.60901 20 
7-36 所 示 。 组 79.2792 4.40754 20 
图 7-35 给 出 了 本 实验 的 一 些 基本 描述 性 统计 量 , 从 中 一 一 
可 以 看 到 三 个 培训 组 经 过 培训 后 的 平均 值 、 标 准 偏差 和 每 图 7-35 ”描述 性 统计 量 
组 的 个 案 数 。 


7-36 给 出 了 本 实验 的 协 方差 分 析 结 果 。 同 时 为 了 对 比 研究 ， 图 7-36〈 右 ) 也 给 出 了 没 
有 协 变量 的 方差 分 析 结果 。 从 中 可 以 看 出 ， 整 个 模型 的 F 值 是 1355.643， 显 著 性 是 0.000， 可 
见 此 方差 分 析 模 型 是 非常 显著 的 ， 并 且 调整 后 R 方 是 0.986， 说 明 培 训 后 得 分 的 变异 能 被 “ 培 
训 前 得 分 ” “培训 组 ”解释 的 部 分 有 98.6%6， 而 若 不 考虑 ， 协 变量 “培训 前 得 分 ”的 方差 分 析 
模型 的 判决 系数 只 有 29.7%。 协 变量 “培训 前 得 分 ”的 显著 性 只 有 0.000， 小 于 显著 水 平 0.05， 
可 见 是 非常 显著 的 ， 并 且 能 被 协 变量 “培训 前 得 分 ”解释 的 离 差 平 方 和 有 5859.267， 而 被 “ 培 
训 组 ”解释 的 只 有 441.026， 因 此 忽略 协 变量 “培训 前 得 分 ”是 不 合适 的 。 


主体 问 效应 检验 主体 间 效 应 检验 

国 变量 培训 后 得 分 因 变 量 ， 培训 后 得 分 
川 美 平方 和 身 由 度 均 方 F 呈 尖 性 源 川 美 平方 和 自由 度 均 方 F 显著 性 
俱 正 贿 玛 。。 8384 958” 3 2794985 1355643 000 修正 本 下 2525 691" 2 1262846 12048 000 
eR FS 人 与 2 截 忠 312270.037 1 312270.037 2979.115 .000 
培 贡 组 441.026 2 220.513 106955 000 si al 2 22 2 
人 FF 省 Fr 误 葵 5974.724 57 104.820 
总 计 320770.453 50 基 计 320770.453 60 
修正 后 总 计 8500.415 人 9 修正 后 怠 计 8500.415 59 

a R 方 = .996 《调整 后 RR 方 = .996) a.R 方 =.297 《调整 后 RR 方 =.272) 


7-36 协 方差 分 析 结果 


7.4 多 因 变 量 方差 分 析 
多 因 变 量 方差 分 析 用 于 研究 控制 变量 对 多 个 因 变 量 的 影响 。 
7.4.1 多 因 变 量 方 差分 析 的 原理 


多 因 变 量 方差 分 析 的 基本 原理 与 单 因 变 量 方差 分 析 的 原理 相似 ,用 于 分 析 控 制 因素 取 不 同 
水 平时 因 变 量 的 均值 是 否 存在 显著 差异 。 但 是 , 多 因 变量 方差 分 析 在 分 析 过 程 中 还 利用 了 各 因 
变量 协 方差 的 相关 信息 。 


7.4.2 ”多 因 变 量 方差 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 多 因 变 量 方差 分 析 。 
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1) 在 菜单 栏 中 选择 “分 析 ”| “一般 线性 模型 ”|“ 多 变量 ”命令 ,打开 “多 变量 ”对 话 框 ， 
如 图 7-37 所 示 。 

2) 选择 变量 。 

从 源 变 量 列表 框 中 选择 需要 进行 方差 分 析 的 因 变量 、 固定 因子 、 协 变 量 。 此 处 的 “ 因 变 量 ” 
列表 框 可 以 选择 多 个 因 变 量 ， 如 图 7-38 所 示 。 


3 党 


凶 
凶 
| 


OO” eye 
图 7-37 “多 变量 ”对 话 框 图 7-38 进行 变量 选择 
3) 进行 相应 的 设置 。 
“多 变量 ”对 话 框 中 的 “模型 ” “对 比 ”“ 图 ”“ 事 后 比较 ”“ 保 存 ”“ 选 项 ”的 具体 设 
置 方法 与 单 变量 多 因素 方差 分 析 相 同 ， 此 处 不 再 效 述 。 
4) 分 析 结 果 输 出 。 
设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 多 因 变 量 方 差分 
析 的 结果 。 


7.4.3 ”实验 操作 
下 面 将 以 数据 文件 “7-4” 为 例 ， 讲 解 多 因 变 量 方差 分 析 的 具体 操作 过 


程 并 对 结果 进行 说 明 。 


1. 实验 数据 描述 


数据 文件 “7-4” 是 某 培训 机 构 对 
3 个 小 组 采用 不 同 的 培训 方法 进行 培 
训 后 的 技能 测试 和 智力 测试 得 分 数 
据 。 下 面 将 利用 多 因 变 量 方差 分 析 方 
法 分 析 三 种 培训 方法 对 学 员 的 技能 
智力 两 个 因 变量 的 影响 ， 本 实验 的 原 
始 数据 如 图 7-39 所 示 。 

在 SPSS 的 变量 视图 中 建立 变量 
“培训 组 ”“ 技 能 测试 ”和 “智力 测 
试 ”， 分 别 表示 培训 组 别 技能 及 智力 
测试 的 得 分 ， 如 图 7-40 所 示 。 7.39 数据 文件 “7.4” 原始 数据 
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O32etisav BR] - BM SPSS Statistics 交配 于 到 = 0 x 


四 | 到 | 到 计 上 和 
[2 
[ 。 型 厂 少 关 计 “新 入 
本 力 到 试 无 无 8 贡 右 ,村 刘 办 入 


Es nc Un ON | 
图 7-40 数据 文件 “7-4” 的 变量 视图 


在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 
数据 如 图 7-41 所 示 。 


Sus wy Bm] OM SPSS Statistics rpm = 


1 
ET FEN : mT mT 


图 7-41 数据 文件 “7-4” 的 数据 视图 


2. 实验 操作 步骤 

ES6) 在 菜单 栏 中 选择 “分 析 ”|“ 一 般 线性 模型 ”| “多 变量 ”命令 ， 打 开 “ 多 变量 ”对 
话 框 。 

GE562 将 “技能 测试 ”和 “智力 测试 ” 选 入 “ 因 变 量 ” 列 表 框 中 ， 将 “培训 组 ” 选 入 “ 国 
定 因 子 ” 列 表 框 中 。 


GE5363 单 击 “ 模 型 ”按钮 ， 弹 出 “多 变量 : 模型 ”对 话 框 ， 选 中 “全 因子 ” 单 选 按钮 ， 其 
他 为 默认 ， 单 击 “ 继 续 ” 按 钮 。 

人 GE5364 单 击 “ 事 后 比较 ”按钮 ， 弹 出 “多 变量 : 实测 平均 值 的 事后 多 重 比较 ”对 话 框 ， 将 
“培训 组 ” 选 入 “下 列 各 项 的 事后 检验 ”列表 框 中 ， 并 选中 “LSD” 复 选 框 ， 单 击 
“继续 ”按钮 保存 设置 结果 。 
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站 二 


EY 
后 单 


可 


图 7-42 给 出 了 本 实验 数据 文件 的 一 些 描述 性 统计 量 ， 从 中 可 以 看 出 ， 两 个 


“继续 ”按钮 。 
GE565 单 击 “ 确 定 ”按钮 ， 输 出 分 析 结果 。 


3. 实验 结果 及 分 析 
SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 7-42~ 图 7-45 所 示 。 


“选项 ”按钮 ， 弹 出 “多 变量 : 选项 ”对 话 框 ， 选 中 “描述 统计 ” 复 选 框 ， 然 


因 变量 “技能 


测试 ”和 “智力 测试 ”中 各 个 小 组 的 平均 值 、 标 准 偏差 和 个 案 数 。 如 第 一 组 的 技能 测试 平均 值 
为 63.5798， 智 力 测试 平均 值 为 55.629。 
7-43 给 出 了 多 变量 检验 的 一 些 结果 ， 从 中 可 以 看 出 ， 各 个 检验 的 显著 性 都 小 于 0.05， 


总 计 58.2757 


10.38507 


图 7-42 ”描述 性 统计 量 

图 7-44 给 出 了 多 因 变 量 方差 分 析 的 结果 ， 从 中 可 以 看 到 ， 在 0.05 的 显著 水 平 下 ， 这 3 种 
培训 方法 对 技能 测试 的 影响 非常 显著 , 但 该 培训 方法 对 智力 测试 的 影响 却 并 不 显著 , 因为 相应 
的 显著 性 是 0.384， 大 于 显著 水 平 0.05。 


因此 各 种 培训 方法 的 影响 是 非常 显著 的 。 比 较 “ 培 训 组 ”中 的 比 莱 轨 迹 值 和 和 霍 特 林 轨迹 值 ， 
可 见 两 者 的 值 分 别 是 0.905 和 8.822， 其 差距 较 大 ， 说 明 各 组 对 模型 的 影响 较 大 。 
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主体 间 效 应 检验 


员 筑 学 方 和 


F 


技能 测试 
界 力 测试 
技能 测试 
智力 测试 
技能 测试 
办 力 测试 
技能 测试 
智力 测试 
技能 测试 
智力 出 斌 


修正 后 总 计 。 技能 测试 


智力 测试 


2525 .691* 
210.184* 
312270.037 
203763.200 
2525.691 
210.184 
5974.724 
6152.947 
320770.453 
210126.330 
8500.415 
6363.130 


1262.846 12.048 
105.092 974 
312270.037 2979.115 
203763.200 1887.633 
1262.846 12.048 
105.092 974 
104.820 
107.946 
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a.R 方 =.297《 油 整 后 RR 方 = .272) 
b.R 方 = .033 (调整 后 RR 方 =-.001) 


7-44 多 因 变 量 方差 分 析 的 结果 


多 变 重 检验 ” 

全 F 租 收 让 出 度 。 误差 自 内 度 牙 作 
描述 统计 [3 992 3463.964" 2000 56000 000 
培训 组 均值 。 标准 偏差 个 案 数 威 尔 克 Lambda 008 。 3463.964 2.000 56.000 000 
技能 测 这 “1 63.5798 。 13.50858 20 时 特 林 因 杰 123713 。 3463.964? 2000 56.000 000 
2 73.5677 “10.60901 20 胃 妇 最 大 用 123713 3463.964? 2.000 56.000 000 
3 792792 440754 20 培训 组 人 比 某 园 连 905 23577 4000 114000 000 
总 计 72.1422 12.00312 60 万 尔 页 Lambda 101 60.043? 4000 112.000 000 
肥力 到 这 1 55.6290 | 13.27082 20 需 特 林 鸭 连 8822 121300 4000 110000 000 
一 一 一 一 一 罗 人 最 上 有 8614 251.210° 2000 57.000 000 

2 59.5680 10.88796 20 - 

.设计 + 我 距 * 培训 组 
E 59.6300 5.40158 20 
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图 7-45 给 出 了 多 重 比 较 结果 ，* 表 示 该 组 均值 差 是 显著 的 。 从 该 图 可 以 看 出 ， 对 技能 的 培 
训 上 ，3 种 培训 方法 之 间 有 显著 的 差别 和 影响 能 力 ， 但 是 这 些 培训 方法 对 智力 的 影响 既 不 显著 
也 没有 明显 的 差别 。 


多 重 比较 
LsD 
站 关 值 人 95% 置信 区 司 
因 变 佑 由 中 (J) | J) 标准 显著 性 限 上 限 
技能 测试 1 2 -9.9879 ”323759 003 -16.4711 。 -3.5047 
3 -15.6995” ”323759 000 -221826 -9.2163 
2 1 9.9879 3.23759 003 35047 16.4711 
有 -57116 3.23759 083 -12.1947 7716 
3 1 15.6995” 323759 000 92163 221826 
2 57116 3.23759 083 -7716 121947 
钾 力 测试 1 2 -3.9390 3.28552 236 -105181 2.6401 
3 -4.0010 3.28552 228 -105801 25781 
2 1 3.9390 3.28552 236 -26401 10.5181 
3 “0620 3.28552 985 -66411 6.5171 
3 1 4.0010 3.28552 228 -25781 10.5801 
2 0620 328552 985 -65171 6.6411 
某 于 实测 平均 值 。 
误 着 项 是 均 方 ( 误 着 ) = 107.946。 
*. 平均 值 凑 值 的 显著 性 水 平 为 .05。 


图 7-45 多 重 比 较 结果 


7.5 上 机 题 


视频 文件 ，\ideo\ 上 机 题 教学 视频 \chap07.wmv 


视频 文件 ，\sample\ 上 机 题 \chap07\… 


7.1 有 甲 、 乙 、 丙 三 个 工厂 分 别 生产 某 种 零件 , 现在 从 每 个 厂家 生产 的 产品 中 各 抽取 12 个 零 
件 检 验 其 寿命 。 试 在 5% 的 显著 性 水 平 下 ， 检 验 三 个 厂家 的 产品 寿命 是 否 具有 显著 差异 。 部 分 相关 
数据 如 下 表 所 示 〈 数 据 路 径 : 视频 文件 sample\ 上 机 题 chap07\ 习 题 \ 第 7 章 第 一 题 .sav) 。 


CS 


(1) 试 采用 莱 文 方差 齐 性 检验 对 该 数据 进行 方差 齐 次 检验 。 
(2) 对 三 个 厂家 的 数据 进行 单 因 素 方差 分 析 ， 分 析 三 个 厂家 产品 寿命 的 差异 。 
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(3) 对 三 个 厂家 数据 进行 多 重 比较 ， 结 合 方差 分 析 的 结果 判断 产品 寿命 差异 。 
7.2” 某 农场 进行 农药 喷 酒 实验， 分 别 在 不 同 的 浓度 情况 下 采用 不 同 的 方式 进行 喷洒 ， 其 
中 “检测 效果 ”为 农药 喷洒 24 小 时 后 农作物 叶子 表面 农药 含量 ， 喷 酒 方式 分 别 为 人 工 〈1) 、 
大 型 农机 作业 〈2) 、 飞 机 作业 〈3) 。 试 在 5% 的 显著 性 水 平 下 ， 检 验 不 同 的 浓度 和 喷 酒 方式 
的 效果 是 否 相同 ， 以 及 交互 作用 的 效应 是 否 显著 。 部 分 数据 如 下 表 所 示 〈 数 据 路 径 : 视频 文件 
\sample\ 上 机 题 \chap07\ 习 题 \ 第 7 章 第 二 题 .sav) 。 
检测 结果 百分比 〈%) 喷洒 方式 


Dl-|-|wlw NI -ww vv |-|- 


(1) 试 计算 因 变 量 在 各 个 因素 下 的 描述 性 统计 量 及 在 各 个 因素 水 平 下 的 误差 方差 的 莱 文 
检验 。 

(2) 对 数据 进行 多 因素 方差 分 析 ， 分 析 不 同 的 浓度 和 喷洒 方式 的 效果 是 否 相同 ， 以 及 交 
互 作 用 的 效应 是 否 显著 。 

7.3 ” 某 研究 所 为 测试 三 种 不 同 的 饲料 对 生猪 体重 增加 的 影响 ， 将 生猪 随机 分 为 三 组 ， 使 
用 这 不 同 的 饲料 喂养 。 理 论 上 认为 ， 生猪 体重 的 增加 受到 原始 体重 的 影响 ， 试 采用 协 方 差分 析 
方法 ， 以 生猪 原始 体重 作为 协 变量 ， 分 析 三 种 饲料 的 作用 是 否 存在 显著 差异 。 部 分 数据 如 下 表 
所 示 〈 数 据 路 径 : 视频 文件 sample\ 上 机 题 \chap07\ 习 题 \ 第 7 章 第 三 题 .sav) 。 


测试 前 体重 《kg) 测试 后 后 体重 《kg) 饲料 


15.00 
13.00 
11.00 
12.00 
12.00 
16.00 
14.00 
17.00 
17.00 
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( 续 表 ) 
测试 前 体重 《kg) 测试 后 后 体重 《kg) 饲料 
16.00 90.00 2.00 
18.00 100.00 2.00 
18.00 95.00 2.00 
21.00 103.00 2.00 
22.00 106.00 2.00 
19.00 99.00 2.00 


(1) 区 分 该 数据 分 析 的 自 变 量 和 协 变量 ， 判 断 协 变量 对 因 变 量 的 影响 。 
(2) 对 生猪 测试 后 体重 的 数据 进行 协 方差 分 析 ， 判 断 不 同 饲养 方式 对 体重 的 影响 。 


7.4” 某 集团 对 旗下 三 个 子 公司 采 用 不 同 的 绩效 评估 方法 评估 绩效 后 的 产值 和 利润 的 数据 。 下 
面 将 利用 多 因 变 量 方差 分 析 方 法 分 析 三 种 绩效 评估 方法 对 子 公 司 的 产值 和 利润 是 否 有 显著 影响 。 
部 分 数据 如 下 表 所 示 “〈 数 据 路 径 : 视频 文件 \sample\ 上 机 题 \chap07\ 习 题 \ 第 7 章 第 四 题 .sav) 。 


评估 方法 利润 ( 百 万 ) 
1 $59.58 48.58 
1 74.65 
1 53.55 
2 72.85 59.85 
2 7517 
2 80.82 67.82 
色 Ah By h 27 
2 81.50 67.50 
2 33.56 
2 81.38 67.38 
2 6996 
2 6298 


(1) 对 三 种 绩效 评估 方法 进行 多 因素 方差 分 析 ， 分 析 评 估 方 法 是 否 显 著 影 响 子 公司 的 产 
值 和 利润 。 

(2) 计算 并 生成 多 重 比 较 结果 ， 结 合 多 因素 方差 分 析 的 结果 判断 哪 种 培训 方法 对 子 公司 
的 产值 和 利润 影响 最 大 。 
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相关 分 析 研 究 现象 之 间 是 否 存 在 某 种 依存 关系 ,并 对 具体 有 依存 关系 的 现象 探讨 其 相关 方 
向 及 相关 程度 , 是 研究 随机 变量 之 间 相 关 关系 的 一 种 统计 方法 。 本章 将 结合 大 量 实例 说 明 如 何 
利用 SPSS 24.0 对 数据 文件 进行 相关 分 析 。 


8.1 相关 分 析 的 基本 原理 


现象 与 现象 之 间 的 依存 关系 ， 从 数量 联系 上 看 ， 可 以 分 为 两 种 不 同 的 类 型 ， 即 函数 关系 和 
相关 关系 。 

函数 关系 是 从 数量 上 反映 现象 间 严格 的 依存 关系 , 即 当 一 个 或 几 个 变量 取 一 定 的 值 时 , 另 
一 个 变量 有 确定 值 与 之 相对 应 。 相 关 关 系 是 现象 间 不 严格 的 依存 关系 , 即 各 变量 之 间 不 存在 确 
定性 的 关系 。 在 相关 关系 中 ， 当 一 个 或 几 个 相互 联系 的 变量 取 一 定数 值 时 ,与 之 相对 应 的 另 一 
变量 值 也 相应 发 生变 化 ， 但 其 关系 值 不 是 固定 的 ， 往 往 按照 某 种 规律 在 一 定 的 范围 内 变化 。 

回归 方程 的 确定 系数 在 一 定 程度 上 反映 了 两 个 变量 之 间 关 系 的 密切 程度 , 并 且 确定 系数 的 
平方 根 就 是 相关 系数 。 但 确定 系数 一 般 是 在 拟 合 回归 方程 之 后 计算 的 , 如 果 两 个 变量 间 的 相关 
程度 不 高 ， 拟 合 回归 方程 便 没 有 意义 ， 因 此 相关 分 析 往 往 在 回归 分 析 前 进行 。 


8.1.1 相关 关系 的 分 类 


现象 之 间 的 相关 关系 按照 不 同 的 标志 有 不 同 的 分 类 。 


(1) 按 相 关 的 程度 划分 ， 现 象 之 间 的 相关 关系 可 以 划分 为 完全 相关 、 不 相关 和 不 完全 相 
关 三 种 。 

当 一 个 现象 的 数量 变化 完全 由 另 一 个 现象 的 数量 变化 所 决定 时 , 称 这 两 种 现象 间 的 关系 为 
完全 相关 ; 当 两 个 现象 彼此 互相 不 影响 ， 其 数量 变化 各 自 独立 时 ， 就 称 为 不 相关 ; 当 两 个 现象 
之 间 的 关系 介 于 完全 相关 和 不 相关 之 间 时 ， 就 是 不 完全 相关 。 

完全 相关 可 以 以 方程 的 方式 呈现 , 因此 , 完全 相关 便 转 化 为 一 般 意义 上 的 函数 关系 ; 通常 
现象 都 是 不 完全 相关 的 ， 这 是 相关 分 析 的 主要 研究 对 象 。 

(2) 按 相 关 的 方向 划分 ， 现 象 之 间 的 相关 关系 可 划分 为 正 相 关 和 负 相关 。 

当 一 个 现象 的 数量 由 小 变 大 , 另 一 个 现象 的 数量 也 相应 由 小 变 大 时 , 这 种 相关 就 称 为 正 相 
关 ; 反之 , 则 称 为 负 相 关 。 需 要 注意 的 是 , 许多 现象 的 正 、 负 相关 的 关系 仅 在 一 定 范围 内 存在 。 

(3) 按 相 关 的 形式 划分 ， 现 象 之 间 的 相关 关系 可 划分 为 线性 相关 和 非 线性 相关 。 

相关 关系 是 一 种 数量 关系 上 不 严格 的 相互 依存 关系 。 当 两 种 相关 关系 之 间 大 致 呈现 出 线性 
关系 时 , 则 称 为 线性 相关 ; 如 果 两 种 相关 现象 之 间 近 似 地 表现 为 一 条 曲线 , 则 称 为 非 线 性 相关 。 

(4) 按照 影响 因素 的 多 少 划分 ,现象 之 间 的 相关 关系 可 划分 为 单 相关 、 复 相关 和 偏 相关 。 
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单 相关 是 两 个 变量 间 的 关系 ,， 即 一 个 因 变 量 对 一 个 自 变量 的 相关 关系 ,也 叫 简 相关 ; 复 相 
关 是 指 三 个 或 三 个 以 上 变量 之 间 的 关系 ， 即 一 个 因 变 量 对 两 个 或 两 个 以 上 自 变量 的 相关 关系 ， 
又 称 多 元 相关 ; 偏 相 关 是 指 某 一 变量 与 多 个 变量 相关 时 , 假定 其 他 变量 不 变 ， 其 中 两 个 变量 的 
相关 关系 。 


在 统计 中 , 通过 制定 相关 图 或 相关 表 ， 可 以 直接 判断 现象 之 间 大 致 呈 何 种 形式 的 关系 , 另 
一 方法 为 精确 描述 变量 间 的 相关 关系 , 即 计算 变量 之 间 的 相关 系数 。 由 于 相关 图 和 相关 表 只 能 
感性 地 反映 出 变量 间 的 相关 关系 ， 本 书 将 主要 介绍 相关 系数 的 计算 方法 。 

对 不 同类 型 的 变量 , 相关 系数 的 计算 公式 也 不 同 。 在 相关 分 析 中 ,常用 的 相关 系数 主要 有 
皮尔 逊 简单 相关 系数 、 斯 皮尔 曼 等 级 相关 系数 、 肯 德尔 等 级 相关 系数 和 偏 相 关系 数 。 皮 尔 逊 简 
单 相关 系数 适用 于 等 间隔 测度 ， 而 斯 皮尔 曼 等 级 相关 系数 和 肯 德 尔 等 级 相关 系数 都 是 非 参 测 
度 。 一 般 用 和 分别 表 示 总 体 相关 系数 和 样本 相关 系数 。 


(1) 皮尔 逊 简 单 相关 系数 

若 随机 变量 著 、 了 的 联合 分 布 是 二 维 正 态 分 布 ，x; 和 六 分 别 为 n 次 独立 观测 值 , 则 计算 P 
和 vr 的 公式 分 别 定义 为 公式 (8-1) 和 公式 (8-2) 。 

_ E[X-ECO][Y- EO))] 


YPCDYDO) 


六 (和 —x)(y, -y) 
一 -一 一 (8-2) 


jz -0 >0， -»)? 
二 1 二 


0 
#1, 7 


其 中 可 以 证 明 ， 样 本 相关 系数 x 为 总 体 相关 系数 p 的 最 大 似 然 估计 量 。 
简单 相关 系数 > 有 如 下 性 质 : 


@ -1 和 rz 受 1， 7 绝对 值 越 大 ， 表 明 两 个 变量 之 间 的 相关 程度 越 强 。 

@ 0<r 硅 1， 表明 两 个 变量 之 间 存 在 正 相 关 。 若 r=1， 则 表明 变量 间 存 在 着 完全 正 相 关 
的 关系 。 

@ 一 1r<0, 表明 两 个 变量 之 间 存在 负 相 关 。r = 一 1 表明 变量 间 存 在 着 完全 负 相 关 的 关系 。 

外 r=0， 表 明 两 个 变量 之 间 无 线性 相关 。 

应 该 注意 的 是 , 简单 相关 系数 所 反映 的 并 不 是 任何 一 种 确定 关系 ,而 仅仅 是 线性 关系 。 另 
外 ， 相 关系 数 所 反映 的 线性 关系 并 不 一 定 是 因果 关系 。 

(2 ) 斯 皮尔 曼 等 级 相关 系数 

等 级 相关 用 来 考察 两 个 变量 中 至 少 有 一 个 为 定 序 变量 时 的 相关 系数 , 例如 , 学 历 与 收入 之 
间 的 关系 。 它 的 计算 公式 如 式 〈8-3) 所 示 : 


(8-1) 
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6 
nm 
式 中 ，d; 表示 y; 的 等 级 和 x; 的 等 级 之 差 ，n 为 样本 容量 。 


(3 ) 肯 德 尔 等 级 相关 系数 
肯 德 尔 等 级 相关 系数 利用 变量 等 级 计算 一 致 对 数目 U 和 非 一 致 对 数目 V， 采 用 非 参数 检 
验 的 方法 度量 定 序 变量 之 间 的 线性 相关 关系 。 其 计算 公式 如 式 (8-4) 所 示 : 
和 
n(n—D) 


(8-3) 


r=(U-V) (8-4) 


8.1.3 ”关于 总 体 相关 系数 p 的 假设 检验 


总 体 相 关系 数 p 的 假设 检验 步骤 与 其 他 假设 检验 步骤 一 致 ， 可 以 分 为 以 下 几 步 : 
1) 提出 原 假设 和 备 择 假设 : 


Ho:p=0 
Hi:p#0 
2) 构造 并 计算 统计 量 
根据 相关 系数 的 类 别 不 同 ， 使 用 不 同 的 检验 统计 量 ， 具 体 如 下 : 
Q@ 皮尔 逊 简单 相关 系数 检验 。 该 相关 系数 对 应 的 统计 量 如 式 〈8-5) 所 示 : 
ryn-2 
1—7? 
其 中 ，r 表示 皮尔 逊 简单 相关 系数 值 ，n 表示 样本 观测 个 数 。 
@ 斯 皮尔 曼 等 级 相关 系数 检验 。 其 小 样本 情况 下 对 应 的 统计 量 如 式 〈8-6) 所 示 ; 


-=D (8-6) 
= 


天 三 


~i(n—2) (8-5) 


于 


大 样本 情况 下 对 应 的 统计 量 如 式 〈8-7) 所 示 : 
Z=rVn-2~ N(0,l) (8-7) 
其 中 ，r 表示 斯 皮尔 曼 等 级 相关 系数 值 ，n 表示 样本 观测 个 数 。 


@ 肯 德 尔 等 级 相关 系数 检验 。 小 样本 情况 下 ， 表 德尔 等 级 相关 系数 服从 肯 德 尔 分 布 。 大 
样本 情况 下 它 对 应 的 检验 统计 量 如 式 (8-8〉 所 示 : 


PA A yo (8-8) 
1 22n +5) 


其 中 ，r 表示 肯 德 尔 等 级 相关 系数 值 ，n 表示 样本 观测 个 数 。 

3) 比较 p 值 和 显著 性 水 平 a ， 做 出 统计 决策 

计算 得 出 p 值 ， 若 j 值 小 于 显著 性 水 平 ， 则 拒绝 原 假设 ， 即 认为 两 个 变量 之 间 的 相关 关 
系 显著 ; 否则， 接受 原 假设 ， 即 认为 变量 之 间 不 存在 显著 相关 性 。 
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8.2” 双 变量 相关 分 析 


生活 中 常 需要 我 们 对 两 个 变量 间 的 相关 关系 进行 分 析 , 即 通过 计算 两 个 变量 之 间 的 相关 系 


数 ， 是 否 显著 相关 作出 判断 。 双 变量 相关 分 析 过 程 为 用 户 提供 了 解决 这 一 问题 的 方法 。 


8.2.1 ” 双 变 量 相关 分 析 的 SPSS 操作 

打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 相关 分 析 。 本 节 主要 介绍 双 变量 相关 分 析 ， 具 体操 作 步 骤 如 下 : 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 相 关 ”|“ 双 变量 ”命令 ， 打 开 如 图 8-1 所 示 的 “ 双 变量 相 
关 性 ”对 话 框 。 

2) 选择 变量 。 

从 源 变 量 列表 框 中 选择 需要 相关 分 析 的 变量 , 然后 单 击 箭头 按钮 国 将 选中 的 变量 选 入 “ 变 
量 ” 列 表 框 中 ， 如 图 8-2 所 示 。 


全 双关 性 X | 本 RE 有 HR 性 x 
国 四 
相关 系 灶 te 
加 皮尔 过 (AD) 四 此 德 丰 tau-b(K) 四 斯 皮尔 县 (S) 同 记 尔 洲 (N) 门 闪 熏 尔 tau-b(I9 门 斯 皮尔 易 (S) 
显著 性 性 过 时 天性 检 沦 
图 双 怀 中 加 单 尽 LL) @ED ORE) 
图 标记 显著 性 相关 性 (E) 加 标记 显著 性 相关 性 (中 ) 
CE] we ETE 
8-1 “ 双 变量 相关 性 ”对 话 框 8-2 选择 相关 分 析 的 变量 


3) 设置 相应 的 选项 。 

“相关 系数 ”选项 组 

该 选项 组 提供 了 三 种 相关 系数 的 复 选 框 ， 分 别 为 “皮尔 示 ”“ 肯 德尔 tau-b(K)” 和 “斯 皮 
尔 曼 ” 复 选 框 , 可 以 计算 皮尔 逊 简单 相关 系数 、 肯 德尔 等 级 相关 系数 和 斯 皮尔 曼 等 级 相关 系数 。 


受 


“显著 性 检验 ”选项 组 
它 包 括 两 个 复 选 框 :“ 双 尾 ” 和 “ 单 尾 ”。 如 果 了 解 变 量 间 是 正 相关 或 负 相 关 , 应 选中 “ 双 
尾 ” 单 选 按钮 ; 否则 ， 应 选中 “ 单 尾 ” 单 选 按钮 。 


“标记 显著 性 相关 性 ” 复 选 框 
如 果 选 中 该 复 选 框 ， 则 在 输出 结果 中 标 出 有 显著 意义 的 相关 系数 。 
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“选项 ”按钮 加 稚 双 变 昌 相 关 性 : 选项 XX 
单 击 “ 选 项 ” 按钮， 打开 如 图 8-3 所 示 的 “ 双 变量 相关 性 : 选 “|” 
项 ”对 话 框 。 该 对 话 框 同样 提供 了 两 个 选项 组 。 i 

Q@ “统计 ”选项 组 。 该 选项 组 用 于 选择 输出 的 统计 量 。 又 积 信和 内 广 C) 

。 选中 “平均 值 和 标准 差 ” 复 选 杠 ， 表 示 为 每 个 变量 计算 并 显 | | Gain RD 
示 其 平均 值 和 标准 差 ， 并 且 显 示 具 有 非 缺 失 值 的 个 案 数 . Oma 人 

。 选中 “又 积 偏差 和 协 方差” 复 选 框 ， 表 示 计算 变量 又 积 偏差 和 | 一] 一 一 
协 方 差 ， 即 为 每 对 变量 显示 双 积 信和 协 方差， 偏 关 的 又 积 等 | [GE 全 


于 校正 均值 变量 的 乘积 之 和 。 这 是 皮尔 各 相关 系数 的 分 子 。 。 图 8.3 。 “ 双 变量 相关 性 ; 
协 方差 是 有 关 两 个 变量 之 间 关 系 的 一 种 非 标准 化 度量 ， 等 于 选项 * 对 话 杠 
又 积 偏差 除 以 N - 1。 

@ “缺失 值 ”选项 组 。 该 选项 组 用 于 选择 处 理 默认 值 的 方法 。 选 中 “成 对 排除 个 案 ” 单 
选 按钮 ， 表 示 在 计算 某 个 统计 量 时 ， 在 这 一 对 变量 中 排除 有 默认 值 的 观测 ， 为 系统 默认 选项 ; 
选中 “成 列 排除 个 案 ” 单 选 按钮 ， 则 表示 对 于 任何 分 析 ， 排 除 所 有 含 默认 值 的 观测 个 案 。 

选项 设置 结束 后 ， 单 击 “ 继 续 ” 按 钮 ， 则 可 返回 主 对 话 框 。 

4) 分 析 结果 输出 。 

所 有 设置 完毕 后 ， 单 击 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 相关 分 析 的 
结果 。 


8.2.2 ”实验 操作 


下 面 将 以 “8-1” 数 据 文件 为 例 ， 讲 解 双 变量 相关 分 析 
的 具体 操作 过 程 并 对 输出 结果 进行 说 明 。 


1. 实验 数据 描述 


“8-1” 数 据 文件 记录 了 北京 和 上 海 两 个 城市 共 21 个 
周岁 儿童 的 身高 调查 数据 , 其 中 北京 市 共有 9 个 样本 数据 ， 
下 面 将 介绍 如 何 利用 双 变 量 分 析 方 法 对 周岁 儿童 身高 和 所 
在 城市 间 的 相关 性 进行 分 析 。“8-1” 数据 文件 的 原始 Excel 
数据 文件 如 图 8-4 所 示 ， 其 中 身高 的 单位 是 厘米 。 

首先 在 SPSS 变量 视图 中 建立 “身高 ”和 “城市 ”两 
个 变量 ， 分 别 表 示 “ 周 岁 儿 童 身 高 ”和 “城市 标记 ”， 两 
个 变量 的 度量 标准 均 为 度量 , 变量 定义 视图 如 图 8-5 所 示 。 

其 次 ， 在 SPSS 数据 视图 中 ， 把 相关 数据 输入 到 变量 
中 ， 其 中 “身高 ”变量 单位 是 厘米 ，“ 城 市 ”变量 中 用 数 
字 1 和 2 分别 代表 北京 和 上 海 两 个 城市 ， 输 入 完毕 后 的 部 
分 数据 如 图 8-6 所 示 。 


8-4 数据 文件 “8-1” 的 原始 数据 
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起 允 立 昌 根 关 分 析 sav | 匡 虹 失 1] - BM SPSs statistics 歼 各 办 生路 = 口 党 


图 8-5 “8-1” 数 据 文件 的 变量 视图 


内 双 妆 旺 但 关 分 析 .sav 珊 电 条 1] - IBM SP5S Statistics 政 据 入 名 路 
文件 (E) 坟 可 人 二 看。 不 据 D) 转换 (分析 南沙 0 ENG)。 用 程序 U) 扩展 09 再 OD 


JBM SPSS Statstcs 外 更生 序 匆 结 Unicode ON 


图 8-6 数据 文件 “8-1” 的 数据 视图 


2. 实验 操作 步骤 


人 GE) 打开 “8-1” 数 据 文 件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 相 关 ”|“ 双 变量 ”命令 ， 打 开 “ 双 变量 相关 性 ”对 话 框 。 

GE502 将 “身高 (厘米 ) ”和 “城市 ” 选 入 “变量 ”列表 框 中 ， 由 于 变量 “城市 ”显然 不 符 
合 正 态 分 布 ， 本 实验 在 “相关 系数 ”选项 组 中 选择 “斯 皮尔 曼 ” 复 选 框 。 

本 03 单 击 “选项 ”按钮 ， 打 开 “ 双 变量 相关 性 : 选项 ”对 话 框 。 选 中 “平均 值 和 标准 差 ” 
“又 积 偏差 和 协 方差 ”两 个 复 选 框 ， 并 选中 “成 对 排除 个 案 ” 单 选 按钮 ， 然 后 单 击 
“继续 ”按钮 ， 保 存 设置 结果 。 
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在 主 对 话 框 中 单 击 “ 确 定 ” 按 钮 ， 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


SPSS Statistics 


查看 器 窗口 的 输出 结果 如 图 8-7 和 图 8-8 所 示 。 


斯 皮尔 要 Rho 。 身高 〈 剧 灯 ) 


相关 性 


相关 系数 

县 著 性 《 双 尾 ) 
个 案 数 

相关 系数 

一 鞭 性 《 双 尾 ) 
个 案 数 


描述 统计 

平均 值 标准 差 个 案 数 
身高 《在 来 ) 71.86 3.979 21 
城市 1.57 507 21 


8-7 ”描述 性 统计 量 


.在 0.01 级 别 ( 双 尾 ) ， 相 关 性 显著 。 


图 8-8 ”相关 分 析 结果 


图 8-7 为 描述 性 统计 量 的 结果 ， 包 括 平 均值 、 标 准 差 和 观测 样本 数 。 

图 8-8 表示 相关 分 析 输 出 结果 ， 城 市 标记 和 周岁 儿童 身高 之 间 的 斯 皮尔 曼 相 关系 数 为 
-0.561， 表 示 二 者 之 间 存 在 不 完全 相关 且 为 负 相关 。 两 者 之 间 不 相关 的 双 侧 显著 性 值 为 
0.008<0.01， 表 示 在 0.01 的 显著 性 水 平 上 和 否定 了 二 者 不 相关 的 假设 。 所 以 由 图 8-7 可 以 得 出 结 
论 : 周岁 儿童 身高 与 城市 存在 显著 相关 关系 。 


8.3 ” 偏 相 关 分 析 


相关 分 析 适 用 于 仅 包 括 两 个 变量 的 数据 分 析 , 当 数 据 文件 包括 多 个 变量 时 , 直接 对 两 个 变 
量 进 行 相关 分 析 ， 往 往 不 能 真实 反映 二 者 之 间 的 相关 关系 ， 此 时 就 需要 用 到 偏 相 关 分 析 ， 得 以 


从 中 剔除 其 他 变量 的 线性 影响 。 
8.3.1 偏 相关 分 析 的 基本 原理 


偏 相关 分 析 也 称 净 相 关 分 析 ， 它 是 在 控制 其 他 变量 的 线性 影响 下 分 析 两 变量 间 的 线性 相 
关 ， 所 采用 的 工具 是 偏 相关 系数 。 假 如 有 8 个 控制 变量 ， 则 称 为 8 阶 偏 相关 。 一 般 的 ,假设 有 


n(n>2) 个 变量 全 ， 开 ; ，… 
(8-9) 所 示 : 


人 


， 马 ， 则 任意 两 个 变量 闷 和 的 8 阶 样本 偏 相 关系 数 公式 如 式 


(8-9) 


te 
hl- 
Se Vd —r2a na rn nb) 


式 中 右边 均 为 g -1 阶 的 偏 相关 系数 ， 


同 组 合 。 


pn 


1 为 自然 数 从 1 到 nn 除去 i 和 j 的 不 


本 节 中 ， 我 们 主要 研究 一 阶 偏 相 关 。 如 分 析 变 量 耻 ,和 不 ,之 间 的 净 相 关 时 ， 控 制 Y, 的 线 
性 关系 ， 天 入 ,之 间 的 一 阶 偏 相 关系 数 如 式 (8-10〉 所 示 : 
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/人 (8-10) 
VA-A)a -a) 
其 假设 检验 过 程 如 下 : 
1) 提出 原 假设 和 备 择 假设 : 
五 o:D=0 
Hi:p#0 


2) 构造 并 计算 统计 量 。 偏 相关 用 到 的 统计 量 为 1 统计 量 ， 其 数学 定义 如 公式 (8-11) 所 


不 : 
t=r, ng) (8-11) 
—r 


式 中 ，7 为 偏 相关 系数 ，” 为 样本 数 ，g 为 阶 数 。 

3) 选取 恰当 的 显著 性 水 平 ， 做 出 统计 决策 。 

若 P 值 小 于 显著 性 水 平 ， 则 拒绝 原 假设 ， 即 认为 两 个 变量 之 间 的 偏 相关 关系 显著 ， 否 则 
接受 原 假设 ， 即 认为 两 变量 之 间 的 偏 相关 系数 与 零 无 显著 差异 。 


8.3.2 ” 偏 相关 分 析 的 SPSS 操作 


在 SPSS Statistics 数据 编辑 器 窗口 中 进行 偏 相 关 分 析 的 操作 步骤 如 下 : 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 相 关 ”|“ 偏 相关 ” 
命令 ， 打 开 如 图 8-9 所 示 的 “ 偏 相关 性 ”对 话 框 。 

2) 选择 变量 。 

从 源 变量 列表 框 中 选择 需要 进行 偏 相关 分 析 的 变 
量 ， 然 后 单 击 第 头 按钮 国 将 选中 的 变量 先入“ 变量” 
列表 框 中 ， 从 源 变量 列表 框 中 选择 控制 变量 ， 单 击 入 
头 按 钮 国 将 选中 的 变量 选 入 “控制 ”列表 框 中 。 

。 “变量 ”列表 框 : 该 列表 框 中 的 变量 是 需要 进行 

偏 相关 分 析 的 ， 因 此 ， 至 少 应 包含 两 个 以 上 的 变 图 8.9 “ 偏 相关 性 ”对 话 框 
量 名 ， 当 其 中 变量 个 数 大 于 等 于 三 个 时 ， 输 出 结 
果 为 两 两 变量 间 偏 相关 分 析 的 结果 。 

。 “控制 ”列表 框 : 该 列表 框 中 显示 的 是 应 该 剔除 

其 影响 的 变量 名 ， 如 果 不 选择 控制 变量 , 则 进行 
的 是 简单 相关 分 析 。 

变量 选择 完成 后 ， 设 置 结果 如 图 8-10 所 示 。 

3) 进行 相应 的 设置 。 

“ 偏 相 关 ” 对 话 框 的 设置 选项 与 “ 双 变量 分 析 ” 


对 话 框 的 设置 选项 相同 ， 用 户 可 以 参照 双 变量 分 析 的 
相关 部 分 自主 学 习 。 8-10 ” 偏 相关 分 析 的 变量 设置 


卜 如 8x 往 x 


”| 
Da 

信人 他 商 拌 访 计 国 

Wi 


EE 
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4) 输出 分 析 结 果 。 
设置 完毕 后 , 单 击 “ 确 定 ” 按钮, 即 可 在 SPSS Statistics 查看 器 窗口 得 到 偏 相 关 分 析 的 结果 。 


8.3.3 ”实验 操作 
下 面 将 以 “8-2” 数 据 文件 为 例 ， 讲 解 偏 相关 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 
1. 实验 数据 描述 
“8-2” 数 据 文件 记录 了 美国 纽约 、 芝 加 哥 、 加 利 福 尼 亚 及 洛杉矶 4 个 城市 的 每 100 人 的 
平均 保健 基金 、 每 1000 人 发 病 率 及 保健 提供 商 拜 访 率 的 数据 ， 每 个 个 案 代表 不 同 的 城市 ， 下 
面 将 介绍 如 何 利用 偏 相 关 分 析 过 程 得 到 在 控制 保健 商 拜 访 率 的 情况 下 , 保险 基金 数量 和 病人 发 
病 率 之 间 的 相关 系数 。“8-2” 数 据 文件 的 Excel 原始 数据 文件 如 图 8-11 所 示 。 


图 8-11 “8-2” 数 据 文件 原始 数据 (部 分 》 


在 SPSS 变量 视图 中 建立 “保健 基金 ”“ 发 病 率 ”“ 保 健 商 拜访 率 ” 和 “城市 ”4 个 变量 ， 
4 个 变量 的 度量 标准 均 为 “度量 ”， 如 图 8-12 所 示 。 


TT a 


es es A Unico ON 
图 8-12 “8-2” 数 据 文件 的 变量 视图 


在 SPSS 数据 视图 中 ， 把 相关 数据 输入 到 变量 中 ， 数 字 1~4 分 别 表示 纽约 、 芝 加 哥 、 加 利 
福 尼 亚 和 洛杉矶 4 个 城市 ， 输 入 完毕 后 的 部 分 数据 如 图 8-13 所 示 。 
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EE 


图 8-13 “8-2” 数 据 文件 的 数据 视图 
2. 实验 操作 步骤 
实验 的 具体 操作 步骤 如 下 : 


507 打开 数据 文件 “8-2”， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 析 ” 
|“ 相 关 ”| “ 偏 相关 ”命令 ， 打 开 “ 偏 相关 性 ”对 话 框 。 

GE562 将 “保险 基金 ”和 “发 病 率 ” 选 入 “变量 ”列表 框 中 ; 将 “保健 商 拜 访 率 ” 选 入 “ 控 
制 ” 列 表 框 中 。 

(GE363 单 击 “ 选 项 ”按钮 打开 “ 偏 相 关 性 : 选项 ”对 话 框 。 选中 ”统计 ”选项 组 中 的 “ 平 
均值 和 标准 差 ” 和 “ 零 阶 相关 性 ”两 个 复 选 框 ， 并 选中 “缺失 值 ”选项 组 中 的 “成 
对 排除 个 案 ” 单 选 按钮 ， 最 后 单 击 “继续 ”按钮 返回 主 对 话 框 ， 保 存 设置 结果 。 


3. 实验 结果 及 分 析 描述 统计 


单 击 “ 确 定 ” 按 钮 ，SPSS Statistics 查看 器 窗口 的 一 
输出 结果 如 图 8-14 和 图 8-15 所 示 。 发 病 来 1751712 2235946 50 

图 8-14 为 描述 性 统计 量 ， 分 别 统计 了 保健 基金 、 保健 商 苦 访 率 174.7488 。 16.26137 50 
发 病 率 和 保健 商 拜 访 率 三 个 变量 的 平均 值 、 标 准 差 和 
观测 值 个 数 。 

图 8-15 为 相关 性 输出 结果 ， 上 半 部 分 表示 没有 控制 变量 时 三 个 变量 两 两 间 的 相关 关系 ， 
从 中 可 以 看 出 , 保健 基金 和 发 病 率 之 间 的 相关 系数 为 0.737， 且 其 在 双 侧 显著 性 0.000 上 显著 ， 
因此 保健 基金 和 发 病 率 间 存在 显著 的 正 相关 性 。 这 显然 有 违 常理 ， 从 经 济 学 上 讲 , 保障 基金 越 
多 , 发 病 率 应 该 相应 越 低 ， 即 保健 基金 和 发 病 率 之 间 应 存在 负 相 关 关系 ， 因 此 ， 在 没有 控制 变 
量 时 得 到 的 保健 基金 和 发 病 率 间 存在 的 正 相关 性 为 伪 相 关 。 

8-15 的 下 半 部 分 给 出 了 含 控制 变量 保健 提供 商 拜 访 率 时 保健 基金 和 发 病 率 间 的 偏 相关 
分 析 结 果 。 从 中 可 以 明显 地 看 到 , 在 剔除 控制 变量 保健 提供 商 拜 访 率 的 影响 后 , 保健 基金 和 发 
病 率 间 的 偏 相关 系数 为 0.013, 显著 性 水 平 为 0.927, 因此 我 们 可 以 认为 保健 基金 和 发 病 率 间 几 
乎 不 存在 相关 关系 。 


8-14 ”描述 性 统计 量 
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相关 性 
控制 变量 保健 基 有 保健 商 大 访 直 
-无 保健 基金 相关 性 1.000 737 964 
旦 车 性 《 双 尾 ) 000 ‘000 
自由 度 0 48 48 
发 请示 相关 性 ”737 1000 762 
旺 甘 性 《 双 尾 ) 000 000 
自由 度 48 0 48 
“保健 商 皇 访 训 “相关 性 964 | 762 | 1000 - 
_ 显著 性 ( 双 尾 ) 000 oo 
自由 度 48 48 0 
保健 商 拜 访 党 。 保健 茶会 相关 性 1.000 013 
显著 性 《 双 尾 ) 927 
自由 度 0 47 
发 晴 率 相关 性 013 1000 
县 车 性 〈 双 尾 ) 927 
自由 度 47 0 


a. 单元 格 包含 堆 阶 (皮尔 避 ) 相关 性 。 


8-15 ”相关 性 输出 结果 


8.4 ”距离 分 析 


偏 相关 分 析 通 过 控制 一 些 被 认为 次 要 的 变量 的 影响 得 到 两 个 变量 间 的 实际 相关 系数 ,但 实 
际 问题 中 ,变量 可 能 会 多 到 无 法 一 一 关心 的 地 步 , 每 个 变量 都 携带 了 一 定 的 信息 , 但 彼此 又 有 
所 重合, 此 时 最 直接 的 方法 就 是 将 所 有 变量 按照 一 定 的 标准 进行 分 类 ， 即 进行 聚 类 分 析 。 本 节 
介绍 的 距离 分 析 便 可 为 聚 类 分 析 提 供 这 一 标准 。 


8.4.1 ”距离 分 析 的 基本 原理 


距离 是 对 观测 量 之 间或 变量 之 间 的 相似 或 不 相似 程度 的 一 种 测度 , 通过 计算 一 对 观测 量 或 
变量 间 的 广义 距离 , 将 距离 较 小 的 变量 或 观测 量 归 为 一 类 , 距离 较 大 的 变量 或 观测 量 归 为 其 他 
类 ， 从 而 为 聚 类 分 析 、 因 子 分 析 等 复杂 数据 集 的 分 析 打 下 基础 。 

与 距离 分 析 相 关 的 统计 量 分 为 非 相似 性 测度 和 相似 性 测度 两 大 类 。 

(1 ) 非 相似 性 测度 

非 相 似 性 测度 主要 通过 分 析 变 量 间 的 不 相似 程度 对 变量 进行 分 类 ， 主 要 包括 : 

。 定 距 数据 : 包括 欧 氏 距离 、 平 方 欧 氏 距离 、Chebychev、 块 、Minkowski 或 定制 等 方法 。 

。 计数 数据 : 包括 卡 方 测量 和 phi 平方 测量 两 种 测度 方法 。 

e 二 分 类 数据 : 包括 欧 氏 距离 、 平 方 欧 氏 距离 、 尺 度 差分 、 模 式 差分 、 方 差 、 形 状 或 Lance 

和 Williams 等 测度 方法 。 

(2) 相似 性 测度 

与 非 相 似 性 测度 相反 , 相似 性 测度 通过 计算 变量 之 间 的 相似 系数 从 而 将 变量 进行 分 类 , 主 
要 包括 : 


。 定 距 数据 : 包括 皮尔 迁 相 关 和 余弦 两 种 测度 方法 。 
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二 分 类 数据 : 包括 Russell 和 Rao、 简 单 匹 配 、Jaccard、 切 块 、Rogers 和 Tanimoto、Sokal 
和 Sneath 1、Sokal 和 Sneath 2、Sokal 和 Sneath 3、Kulczynski 1、 Kulczynski2、Sokal 和 
Sneath 4、Hamann、Lambda、Anderberg 的 D、Yule 的 Y、Yule 的 Q、Ochiai、Sokal 和 
Sneath 5、phi4 点 相关 或 离 差 等 20 多 种 测度 方法 。 


相似 性 测度 及 非 相 似 性 测度 方法 的 详细 介绍 如 下 文中 的 表 8-1 和 8-2 所 示 。SPSS 软件 可 


以 用 来 进行 距离 分 析 ， 距离 分 析 不 会 给 出 常用 的 显著 性 , 而 只 是 给 出 各 变量 间 的 距离 大 小 ,由 
用 户 自行 判断 其 相似 的 程度 。 


8.4.2 ”距离 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 距离 分 析 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 相 关 ”|“ 距 离 ” 命 令 ， 打 开 “ 距 离 ” 对 话 框 ， 如 图 8-16 
所 示 。 
2) 选择 变量 。 
从 源 变量 列表 框 中 选择 需要 进行 距离 分 析 的 变量 ， 然 后 单 击 箭头 按钮 图 将 选中 的 变量 选 
入 “变量 ”或 “个 案 标 注 依 据 ” 列 表 框 中 ， 如 图 8-17 所 示 。 


[EE] 齿 中 可 x 
ww: 
[人 是 | 而 HE 
粮 祝 
PNM 果 
2 中 凶 
A 棉花 
ot [一 人 素 标 主 代 揭 山 : 一 个 要 标 主 依据 内: 
4 邮 四 
计划 站 可 HH 而 
加 个 里 且 C) 口 有 重 司 B) 回 人 党 月 C) O 支 量 间 B) 
而 一 一 一 一 一 一 一 | 理 一 一 一 
回 丰 相似 性 |D) 相似 性 (S) 回 丰 相似 性 D) O 相似 性 (G) 
Pr Er 


8-16 “距离 ”对 话 框 图 8-17 选择 距离 分 析 的 变量 


“变量 ”列表 框 : 该 列表 框 用 于 选 入 距离 分 析 的 变量 ， 至 少 包含 两 个 变量 ， 可 以 为 连续 变 
量 或 分 类 变量 。 


“个 案 标注 依据 ”列表 框 : 该 列表 框 用 于 选 入 个 案 标 注 变量 ， 只 有 在 “计算 距离 ”选项 组 
中 选中 “个 案 间 ” 单 选 按钮 ， 此 列表 框 才 可 使 用 。 

3) 进行 简单 的 设置 。 

“计算 距离 ”选项 组 


该 选项 组 包括 “个 案 间 ”和 “变量 间 ” 两 个 单 选 按钮 ， 若 选中 ， 则 分 别 表示 输出 结果 是 个 
案 间 或 变量 间 的 距离 分 析 值 。 
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“测量 ”选项 组 


该 选项 组 包括 “ 非 相似 性 ”和 “相似 性 ”两 个 
单 选 按钮 和 一 个 “测量 ”按钮 。 关 于 非 相似 性 测度 
和 相似 性 测度 的 详细 设置 ， 下 面 将 单独 进行 介绍 。 so - - 

4) 非 相似 性 测度 的 详细 设置 。 "ny 

若 选中 “ 非 相 似 性 ” 单 选 按钮 ， 表 示 所 用 测度 sw: 
方法 为 非 相似 性 测度 。 此 时 单 击 “ 测 量 ” 按 钮 ， 将 
弹出 “距离 ， 非 相似 性 测量 ”对 话 框 ， 如 图 8-18 


「 转换 烈 里 


所 示 ， 在 这 里 可 继续 进行 设置 。 oh 
S 加 重新 标 度 到 0-1 范围 (E) 
“测量 ”选项 组 
该 选项 组 用 于 选择 测量 标准 ， 根 据 数据 类 型 分 oj mm 
为 区 间 、 计 数 和 二 元 3 种 。 各 单 选 按钮 的 详细 介绍 。 图 818 “距离 ， 非 相似 性 测量 "对话 杠 
如 表 8-1 所 示 。 
表 8-1 “测量 ”选项 组 内 容 
测量 标准 测度 方法 含义 
区 间 欧 氏 距离 各 项 值 之 间 平 方差 之 和 的 平方 根 ， 这 是 定 距 数据 的 默认 选项 
平方 欧 氏 距离 各 项 值 之 间 平 方差 之 和 
Chebychev 各 项 值 之 间 的 最 大 绝对 差 
块 各 项 值 之 间 绝对 差 之 和 ， 又 称 为 Manhattan 距离 
Minkowski 各 项 值 之 间 p 次 寡 绝 对 差 之 和 的 p 次 根 。 选 择 此 项 还 需要 在 “ 守 ” 和 “ 根 
”下 拉 列 表 框 中 选择 显著 性 和 r 值 ， 其 取 值 范围 均 在 1~4 之 间 
定制 各 项 值 之 间 p 次 寡 绝 对 差 之 和 的 r 次 根 。 选 择 此 项 还 需要 在 “ 寡 ” 和 “ 根 
”下 拉 列 表 框 中 选择 显著 性 和 r 值 ， 其 取 值 范围 均 在 1~4 之 间 
计数 卡 方 度量 此 测量 基于 对 两 组 频率 等 同性 的 卡 方 检验 ， 是 计数 数据 的 默认 值 
phi 平方 度量 此 测量 等 于 由 组 合 频率 的 平方 根 标准 化 的 卡 方 测量 
二 元 欧 氏 距离 根据 四 重 表 计 算 SQRT(btc) 得 到 ， 其 中 b 和 c 代 表 对 应 于 在 一 项 上 存在 但 
在 另 一 项 上 不 存在 的 个 案 的 对 角 单元 
欧 氏 距离 计算 非 协调 的 个 案 的 数目 。 它 的 最 小 值 为 0， 没 有 上 限 
大 小 差 值 非 对 称 性 指数 ， 其 范围 为 0 到 1 
模式 差 值 用 于 二 分 类 数据 的 非 相似 性 测量 ， 其 范围 为 0 到 1。 根 据 四 重 表 计 算 
bc/(n**2) 得 到 ， 其 中 b 和 c 代 表 对 应 于 在 一 项 上 存在 但 在 另 一 项 上 不 存 
在 的 个 案 的 对 角 单元 ，n 为 观察 值 的 总 数 
方差 根据 四 重 表 计算 (btc)/4n 得 到 ， 其 中 b 和 c 代 表 对 应 于 在 一 项 上 存在 但 在 
另 一 项 上 不 存在 的 个 案 的 对 角 单 元 , n 为 观察 值 的 总 数 。 其 范围 为 0 到 1 
形状 此 距离 测量 的 范围 为 0 到 1， 它 对 不 匹配 项 的 非 对 称 性 加 以 惩罚 
Lance 和 Williams | 又 称 为 Bray-Curtis 非 量度 系数 ， 根 据 四 重 表 计 算 (b+c)/(2atb+c) 得 到 , 其 
中 a 代表 对 应 于 两 项 上 都 存在 的 个 案 的 单元 , b 和 c 代表 对 应 于 在 一 项 上 
存在 但 在 另 一 项 上 不 存在 的 个 案 的 对 角 单元 。 此 度量 的 范围 为 0 到 1 
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此 外 ， 若 选中 “二 元 ” 单 选 按钮 ， 用 户 可 以 更 改 “ 存 在 ”和 “不 存在 ”字段 以 指定 可 指示 
某 个 特征 存在 或 不 存在 的 值 ， 存 在 的 默认 值 为 1， 不 存在 的 默认 值 为 0。 该 过 程 将 忽略 所 有 其 
他 值 。 

“转换 值 ”选项 组 

在 此 设置 计算 距离 之 前 对 观测 量 或 变量 进行 标准 化 的 方法 ,但 是 要 注意 对 二 元 变量 不 能 进 
行 标准 化 。 在 “标准 化 ”下 拉 列 表 框 中 ， 除 “无 ”外 ， 可 选 的 标准 化 方法 如 表 8-2 所 示 。 

表 8-2 标准 化 方法 及 其 介绍 

标准 化 方法 含义 
Z 得 分 将 值 标准 化 到 均值 为 0 且 标准 差 为 1 的 Z 得 分 
范围 -1 到 1 要 进行 标准 化 的 项 的 每 个 值 均 除 以 值 范围 
范围 0 到 1 该 过 程 从 要 进行 标准 化 的 每 个 项 中 抽取 最 小 值 ， 然 后 除 以 范围 
1 的 最 大 量 级 该 过 程 将 要 进行 标准 化 的 项 的 每 个 值 除 以 这 些 值 中 的 最 大 值 
该 过 程 将 要 进行 标准 化 的 项 的 每 个 值 除 以 这 些 值 的 均值 
使 标准 差 为 1 该 过 程 将 要 进行 标准 化 的 变量 或 个 案 的 每 个 值 除 以 这 些 值 的 标准 差 


以 上 各 标准 化 方法 均 需 要 指定 标准 化 的 对 象 。 若 选中 “ 按 变 量 ” 单 选 按钮 ， 表 示 对 变量 进 
行 标准 化 ， 若 选中 “ 按 个 案 ” 单 选 按钮 ， 则 表示 对 每 个 观测 量 进行 标准 化 。 

“转换 测量 ”选项 组 

在 此 设置 对 距离 测度 的 结果 进行 转换 的 方法 , 可 用 的 选项 有 绝对 值 、 变 化 量 符号 和 重新 标 
度 到 0~!1 范围 。 


。 相关 性 的 方向 可 用 符号 来 表示 ， 当 仅 对 相关 性 的 大 小 感 兴趣 时 , 则 可 选中 “绝对 值 ” 复 选 框 。 

。 着 选 中 “变化 量 符号 ” 复 选 框 ， 则 表示 改变 距离 的 符号 ， 如 此 可 以 把 非 相 似 性 测度 转换 成 
相似 性 测度 ， 反 之 亦 然 。 

。 若 选中 “重新 标 度 到 0-1 范围 ” 复 选 框 ， 则 表示 转换 后 的 取 值 范围 是 0~1， 对 已 经 在 “ 转 
换 值 ”选项 组 中 进行 相关 设置 后 的 测度 一 般 不 再 使 用 此 方法 。 


5) 相似 性 测度 的 详细 设置 [CE 
在 “测量 ”选项 组 中 选中 “相似 性 ” 单 选 按钮 ，。 | 
表示 所 用 测度 方法 为 相似 性 测度 。 此 时 单 击 “ 测 量 ” | | -ae 3 
按钮 ， 将 弹出 如 图 8-19 所 示 的 “距离 ， 相 似 性 测量 ” me 国 本 
对 话 框 。 = 
“距离 ， 相 似 性 测量 ”对 话 框 与 “距离 ， 非 相似 | wewa 一 一 | ew 
性 度量 ”对 话 框 大 体 相似 , 仅 在 度量 标准 中 有 所 差别 ， D3 me 
“距离 ， 相似 性 测量 ”对 话 框 中 没有 “计数 ”这 一 项 。 
“区 间 ” 及 “二 元 ” 单 选 按钮 的 “度量 ”下 拉 列 表 杠 | 


也 稍 有 不 同 。 图 8-19 “距离 ， 相似 性 测量 ”对 话 框 
中 “测量 ”选项 组 。 该 选项 组 用 于 选择 测度 类 型 ， 根 据 数据 类 型 分 为 区 间 和 二 元 两 种 ， 
详细 内 容 如 表 8-3 所 示 。 
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表 8-3 “测量 ”选项 组 内 容 及 介绍 


度量 标准 


测度 方法 


含义 


区 间 


皮尔 逊 相关 性 


表示 两 个 值 矢量 之 间 的 积 矩 相关 性 ， 是 定 距 数 据 的 缺 省 相似 性 测量 


余弦 


表示 两 个 值 矢量 之 间 角 度 的 余弦 


204 


Russell 和 Rao 


内 积 的 二 元 版 本 ， 对 匹配 项 和 不 匹配 项 给 予 相等 的 权重 ， 这 是 二 元 相似 性 
数据 的 缺 省 度量 


简单 匹配 


这 是 匹配 项 与 值 总 数 的 比率 ， 对 匹配 项 和 不 匹配 项 给 予 相等 的 权重 


Jaccard 


在 此 指数 中 ， 不 考虑 联合 不 存在 项 ， 对 匹配 项 和 不 匹配 项 给 予 相 等 的 权 
重 ， 又 称 为 相似 率 


笋 于 


Rogers 和 
Tanimoto 


在 此 指数 中 ， 不 考虑 联合 不 存在 项 ， 对 匹配 项 则 给 予 双 倍 权重 ， 又 称 
Czekanowski 或 Sorensen 度 量 


在 此 指数 中 ， 对 不 匹配 项 给 予 双 倍 权重 


Sokal 和 
Sneath1 


在 此 指数 中 ， 对 匹配 项 给 予 双 倍 权重 


Sokal 和 Sneath 2 


Sokal 和 Sneath 3 


Kulczynski 1 


Kulczynski 2 


Sokal 和 Sneath 4 


在 此 指数 中 ， 对 不 匹配 项 给 予 双 倍 权重 ， 不 考虑 联合 不 存在 项 

这 是 匹配 项 与 不 匹配 项 的 比率 ， 此 指数 有 下 限 0， 无 上 限 。 理 论 上 ， 当 没有 
不 匹配 项 时 ， 此 指数 就 未 定义 ， 然 而 ，“ 距 离 ”在 未 定义 该 值 或 该 值 大 于 
9999.999 时 会 指定 随意 值 9999.999 

这 是 联合 存在 项 与 所 有 不 匹配 项 的 比率 ， 此 指数 有 下 限 0， 无 上 限 。 同 样 ， 
当 没 有 不 匹配 项 时 ， 此 指数 就 未 定义 ，“ 距 离 ” 在 未 定义 该 值 或 该 值 大 于 
9999.999 时 会 指定 随意 值 9999.999 

此 指数 基于 特征 在 一 个 项 中 存在 的 情况 下 也 在 另 一 个 项 中 存在 的 条 件 概率 。 将 
充当 另 一 个 项 的 预测 变量 的 各 个 项 的 各 个 值 进行 平均 ， 以 计算 此 值 

此 指数 基于 一 个 项 中 的 特征 与 另 一 个 项 中 的 值 相 匹配 的 条 件 概率 。 将 充当 
另 一 个 项 的 预测 变量 的 各 个 项 的 各 个 值 进行 平均 ， 以 计算 此 值 


Hamann 


此 指数 为 匹配 数 减 去 不 匹配 数 ， 再 除 以 总 项 数 。 其 范围 为 -1 一 1 


Lambda 


Anderberg 的 D 


此 指数 为 Goodman 和 Kruskal 的 lambda。 通 过 使 用 一 个 项 来 预测 另 一 个 项 
(双向 预测 ) ， 从 而 与 误差 降低 比例 (PRE) 相对 应 。 值 范围 为 0 到 1 

类 似 于 lambda， 此 指数 通过 使 用 一 个 项 来 预测 另 一 个 项 〈 双 向 预测 ) ， 从 
而 与 实际 误差 降低 相对 应 。 值 范围 为 0 一 1 


Yule 的 Y 


此 指数 为 2* 2 表 的 交 比 函数 ， 独 立 于 边际 总 计 ， 其 范围 为 -1 一 1， 又 称 为 
捆绑 系数 


Yule 的 Q 


此 指数 为 Goodman 和 Kruskal 的 gamma 的 特殊 情况 。 它 是 一 个 交 比 函数 , 独 
立 于 边际 总 计 ， 其 范围 为 -1 一 1 


Ochiai 


此 指数 是 余弦 相似 性 测量 的 二 分 类 形式 ， 其 范围 为 0 一 1 


Sokal 和 
Sneath 5 


此 指数 是 正 匹 配 和 负 匹 配 的 条 件 概率 的 几何 平均 数 的 平方 。 它 独立 于 项 目 
编码 ， 其 范围 为 0 到 1 


phi 4 点 相关 


此 指数 是 皮尔 逊 相关 系数 的 二 分 类 模拟 ， 其 范围 为 -1 一 1 


离散 


此 指数 的 范围 为 -1 一 1 
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这 里 用 户 同 样 可 以 更 改 “ 存 在 ”和 “不 存在 ”字段 以 指定 可 指示 某 个 特征 存在 或 不 存在 的 
值 ， 存 在 的 默认 值 为 1， 不 存在 的 默认 值 为 0， 该 过 程 也 将 忽略 所 有 其 他 值 。 

@ “转换 值 ”和 “转换 测量 ”选项 组 。 与 “距离 : 非 相似 性 测量 ”对 话 框 中 的 相关 设置 
一 致 ， 在 此 不 再 歼 述 。 


8.4.3 ”实验 操作 
下 面 将 以 数据 文件 “8-3” 为 例 ， 讲 解 距离 分 析 的 操作 过 程 并 对 输出 结果 进行 说 明 。 
1. 实验 数据 描述 


数据 文件 “8-3” 描 述 了 我 国 31 省 市 各 类 农产品 种 植 面 积 ， 下 面 我 们 将 利用 该 数据 说 明 如 
何 通过 距离 分 析 得 到 各 类 农作物 产品 间 的 相似 系数 。 该 数据 文件 的 原始 Excel 数据 如 图 8-20 
所 示 。 


a 5 ). 和 
Pl 
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0 


0. 
0. 
0. 
0. 
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图 8-20 “8-3” 数 据 文件 原始 数据 
在 SPSS 的 变量 视图 中 ， 建 立 “ 地 区 ”变量 ， 表 示 各 个 省 市 ， 建立 “粮食 ”“ 瓜 果 ”“ 蔬 
菜 ”“ 棉 花 ” “烟叶 ”“ 油 料 ” 和 “ 糖 料 ” 变 量 ， 分 别 表示 各 种 农作物 的 种 植 面积 ， 如 图 8-21 
所 示 。 


[有一 一 =- 6 x 
[xHE) WUE) Rt) MW) WAD HW BNW ENG SNAFU) #R VOUD MO 


[mR A | Car ji 对 齐 。 到 里 Tr] 

本 在 名 名 久生 入 
1 泛 百 作 和 六 入 
11 对 襄 少林 是 ~\ 的 入 
11。 泛 吝 六 闪 要 级 入 
于 证 少 轩 时 多 入 
人 1。 甬 吝 六 村 要 \ 角 入 
11 性 在 AP 村 轩 输入 
11 要 在 他 夺 请 全 入 


EEE EE 


加 负 四 加 加 加 全 


图 8-21 “8-3” 数 据 文件 的 变量 视图 
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在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 
数据 如 图 8-22 所 示 。 


CP a 
六 村 四 EE 二 和 DD) 亲信 中 分 析 的 击 NUD) RWG) 所 UW) 扩 要 0 盏 Do。 而) 


辐 电 允 2 -| | SO 


BM SP3S Stabstics 外 于 各 序 视 绩 Unicode ON 


8-22 “8-3” 数 据 文件 的 数据 视图 


2. 实验 操作 步骤 


GES56) 打开 “8-3” 数 据 文件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 相 关 ”|“ 距 离 ” 命 令 ， 打 开 “ 距 离 ” 对 话 框 。 

人 GES362 选中 所 有 变量 ， 单 击 箭头 按钮 鸭 将 除 “ 地 区 ”之 外 的 所 有 变量 选 入 “变量 ”列表 框 
中 ;分别 选中 “变量 间 ” 和 “相似 性 ” 单 选 按钮 。 

GE5363 单 击 “ 测 量 ”按钮 ， 弹 出 “距离 :相似 性 测量 ”对 话 框 ， 在 “区 间 ” 的 “测量 ”下 
拉 列 表 框 中 选择 “皮尔 逊 相关 性 ”选项 ， 在 “转换 值 ”选项 组 的 中 “标准 化 ”下 拉 
列表 框 中 选择 “2Z 分 数 ”， 其 他 设置 均 选择 默认 值 。 


UD 


3. 实验 结果 及 分 析 
单 击 “ 确 定 ” 按 钮 ， 实 验 输出 结果 如 图 8-23 和 图 8-24 所 示 。 
个 案 处 理 摘要 
i 
有 效 缺失 总 计 
个 案 数 百分比 个 案 数 百分比 个 案 数 百分比 
30 96.8% 1 3.2% 31 100.0% 


图 8-23 ”距离 分 析 案 例 处 理 摘要 


8-23 给 出 了 距离 分 析 案例 处 理 摘要 ， 由 结果 可 以 明显 看 出 “8-3 ”数据 文件 共有 31 个 
个 案 ， 其 中 30 个 省 市 的 数据 完整 ， 有 1 个 省 市 的 数据 中 存在 缺失 值 。 

图 8-24 给 出 了 各 变量 之 间 的 相似 矩阵 ， 从 中 可 以 看 出 各 变量 间 的 相关 系数 极 低 ， 说 明 各 
种 作物 种 植 面 积 之 间 的 相关 性 不 高 ， 这 与 我 们 的 预期 基本 符合 。 

另外 ， 本 例 也 可 以 考虑 对 变量 进行 非 相 似 性 测度 ， 输 出 结果 为 所 有 变量 的 不 相似 矩阵 。 
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近似 值 窍 阵 
值 的 向 重 之 同 的 相关 性 
粮食 瓜 果 革 4 烟叶 t 糖 料 

粮食 1.000 -.429 -.583 404 044 166 334 
瓜 洒 429 1.000 562 083 331 258 001 
兹 某 583 562 1.000 -.091 041 285 200 
棉花 404 083 091 1.000 -.193 172 048 
烟叶 044 331 041 -.193 1.000 074 121 
油料 -.166 -.258 -.285 -.172 -.074 1.000 -.236 
糖 料 -.334 -.001 200 -.048 121 -.236 1.000 


这 是 相似 性 矩阵 


图 8-24 距离 分 析 近 似 值 矩阵 
85 上 机 题 


视频 文件 ，\video\ 上 机 题 教学 视频 \chap08.wmv 


视频 文件 ，\sample\ 上 机 题 \chap08\..… 


8.1 下 面 的 数据 表 给 出 了 某 省 1978 年 ~2003 年 的 GDP 与 城镇 居民 消费 额 的 全 部 数据 ， 
经 济 理论 认为 ， 居 民 消 费 额 与 GDP 呈正 向 相关 关系 。 试 利用 相关 分 析 ， 验 证 这 一 结论 。 ( 数 
据 路 径 : 视频 文件 \sample\ 上 机 题 \chap08\ 习 题 \ 第 8 章 第 一 题 .sav) 


年 份 消费 额 〈 百 万 ) GDP ( 亿 ) 
1978 529 316 
1979 544 350 
1980 632 402 
1981 662 472 
1982 642 531 
1983 633 611 
1984 642 765 
1985 737 887 
1986 795 956 
1987 933 1131 
1988 1160 1395 
1989 1277 1595 
1990 1310 1815 
1991 1501 2122 
1992 1893 2556 
1993 2150 3222 
1994 3079 4473 
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( 续 表 ) 
年 份 消费 额 〈 百 万 ) GDP ( 亿 ) 
1995 3788 5758 
1996 4376 6834 
1997 5124 7590 
1998 5450 8128 
1999 6060 8673 
2000 6572 9555 
2001 6923 10465 
2002 7145 11645 
2003 7740 13361 


8.2 ” 某 调查 者 想 考 察 果汁 饮料 销售 量 的 影响 因素 ， 为 此 调查 者 观察 了 碳酸 饮料 销售 量 、 
茶 饮 料 销售 量 、 固 体 冲 泡 饮 料 销售 量 和 咖啡 类 饮料 的 销售 量 , 单位 均 为 万 升 , 全 部 数据 如 下 表 
所 示 。 试 求 果汁 饮料 销售 量 与 碳酸 饮料 销售 量 的 偏 相关 系数 。 (数据 路 径 ， 视频 文 件 \sample\ 
上 机 题 \chap08\ 习 题 \ 第 8 章 第 二 题 .sav) 


年 份 果汁 咖啡 类 饮料 
1994 23.69 4.18 
1995 24.1 2.43 
1996 22.74 6.5 
1997 17.84 25.78 
1998 18.27 28.16 
1999 20.29 24.26 
2000 22.61 30.18 
2001 26.71 17.08 
2002 EI 9 
2003 30.5 3.88 
2004 29.63 10.53 
2005 29.69 20.09 
2006 29.25 21.22 
2007 31.05 12.63 
2008 32.28 vs 


8.3 ”三 名 评委 A、B、C 分 别 为 20 件 美术 特长 生 的 考试 作品 给 出 了 不 同 的 评级 (1~10 级 )， 
评级 如 下 表 所 示 。 试 计算 三 名 评委 所 给 等 级 的 距离 ， 判 断 三 名 评委 的 评判 标准 的 相似 性 。( 数 
据 路 径 : 视频 文件 \sample\ 上 机 题 \chap08\ 习 题 \ 第 8 章 第 三 题 .sav) 
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回归 分 析 是 研究 一 个 因 变 量 与 一 个 或 多 个 自 变 量 之 间 的 线性 或 非 线性 关系 的 一 种 统计 分 
析 方 法 。 回 归 分 析 通 过 规定 因 变 量 和 自 变量 来 确定 变量 之 间 的 因果 关系 ,建立 回归 模型 ， 并 根 
据 实测 数据 来 估计 模型 的 各 个 参数 , 然后 评价 回归 模型 是 否 能 够 很 好 地 拟 合 实测 数据 ; 并 可 以 
根据 自 变量 作 进 一 步 预测 。 回归 分 析 方法 理论 成 熟 , 它 可 以 确定 变量 之 间 的 定量 关系 并 进行 相 
应 的 预测 , 反映 统计 变量 之 间 的 数量 变化 规律 , 为 研究 者 准确 把 握 自 变量 对 因 变 量 的 影响 程度 
和 方向 提供 有 效 的 方法 ， 在 经 济 、 金 融和 社会 科学 方面 具有 广泛 的 应 用 。SPSS 24.0 提供 强大 
的 回归 分 析 功能 ， 可 以 进行 线性 回归 、 曲 线 回 归 、Logistic 回归 、 非 线性 回归 等 多 种 分 析 ， 下 
面 将 对 回归 分 析 进 行 介绍 。 


9.1 线性 回归 分 析 


线性 回归 分 析 是 常用 的 回归 分 析 , 许 多 非 线性 的 模型 形式 亦 可 以 转化 为 线性 回归 模型 进行 
分 析 。 
9.1.1 线性 回归 分 析 的 原理 


线性 回归 分 析 法 是 基本 的 回归 分 析 方 法 , 其 假设 自 变量 和 因 变 量 之 间 存 在 线性 关系 , 线性 

可 归 的 数学 模型 如 公式 〈9-1) 所 示 。 
y=a+Bx+PBx+…+Px+e (9-1) 

用 矩阵 形式 表示 为 公式 (9-2) : 


互 


y=a+XPp+e (9-2) 


1 oh Bh 
其 中 : 了 =| 六 | 为 被 解释 变量 ，a =| 92 | 为 模型 的 截 距 项 ， = hb 为 待 估计 参数 ; 


» On hb 
Mi Me Ms a 
三 | Xx xz wok | 为 解释 变量 ，&=| 2 | 为 误差 项 。 
I &, 


可 n 


被 解释 变量 的 变化 可 以 由 a+Xp 组 成 的 线性 部 分 和 随机 误差 项 s, 两 部 分 解释 。 对 于 线性 
模型 ， 一 般 采 用 最 小 二 乘 估 计 法 来 估计 相关 的 参数 。 以 一 元 线性 回归 为 例 ， 满 足 公式 (9-3) 
的 未 知 参数 a 和 的 估计 值 称 为 未 知 参数 a 和 的 最 小 二 乘 估计 。 估 计 相 关 的 参数 是 回归 分 
析 的 核心 ， 也 是 预测 的 基础 。 
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minye = 六 Oo- 人 (9-3) 


9.1.2 ”线性 回归 分 析 的 SPSS 操作 
在 SPSS Statistics 数据 编辑 器 窗口 中 进行 线性 回归 分 析 的 操作 步骤 如 下 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 回 归 ”|“ 线 性 ”命令 ， 打 开 如 图 9-1 所 示 的 “线性 回归 ” 
对 话 框 。 


=] 


FA 国定 资产 投 询 ] 块 (B)1J1 = 


图 9-1 “线性 回归 ”对 话 框 

2) 选择 变量 。 

从 源 变量 列表 框 中 选择 需要 进行 线性 回归 分 析 的 被 解释 变量 ， 然 后 单 击 国 按 钮 将 选中 的 
变量 选 入 “ 因 变 量 ” 列 表 框 中 ; 从 源 变量 列表 框 中 选择 需要 进行 线性 回归 分 析 的 解释 变量 ， 单 
击 国 按 钮 将 选中 的 变量 选 入 “ 自 变量 ”列表 框 中 。 

Q@ 因 变 量 。 该 列表 框 中 的 变量 为 线性 回归 模型 中 的 被 解释 变量 ， 数 值 类 型 为 数值 型 。 如 
果 被 解释 变量 为 分 类 变量 ， 则 可 以 用 二 元 或 者 多 元 logistic 模型 等 进行 建 模 分 析 。 

@ 自 变 量 。 该 列表 框 中 的 变量 为 线性 回归 模型 的 解释 变量 或 控制 变量 ， 数 值 类 型 一 般 为 
数值 型 。 如 果 解 释 变 量 为 分 类 变量 或 定性 变量 ,可 以 用 虚拟 变量 ( 哑 变 量 ) 表示 。 如 果 选 择 多 
个 自 变量 ， 则 可 以 将 自 变量 分 组 成 块 ， 通 过 “上 一 个 ”和 “下 一 个 ”按钮 对 不 同 的 变量 子 集 指 
定 不 同 的 输入 方法 。 如 可 以 使 用 “逐步 ” 式 选 择 将 一 个 变量 块 输入 到 回归 模型 中 ， 而 使 用 “前 
进 ” 式 选择 输入 第 二 个 变量 块 。 要 将 第 二 个 变量 块 添加 到 回归 模型 ， 可 单 击 “ 下 一 个 ”按钮 。 

@ 方法 。 该 下 拉 列 表 框 用 于 选择 线性 回归 中 变量 的 输入 和 剔除 方法 ， 以 建立 多 个 回归 模 
型 ， 包 括 : 


。 输入 ， 选 中 该 方法 表示 所 有 的 “ 自 变 量 ”列表 框 中 的 变量 都 输入 回归 模型 。 

。 逐步 ， 选 中 该 方法 表示 不 在 方程 中 的 具有 下 统计 量 的 概率 最 小 的 自 变量 被 选 入， 对 于 
已 在 回归 方程 中 的 变量 ， 如 果 它 们 的 下 统计 量 的 概率 变 得 足够 大 ， 则 移 去 这 些 变量 ， 
如 果 不 再 有 变量 符合 包含 或 移 去 的 条 件 ， 则 该 方法 终止 。 
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。 删除 ， 选 中 该 方法 表示 建立 回归 模型 前 定制 一 定 条 件 ， 然 后 根据 条 件 删除 自 变量 。 

。 后 退 ， 选 中 该 方法 表示 首先 将 所 有 变量 选 入 到 模型 中 ， 然 后 按 顺 序 移 去 ， 最 先 删除 与 因 变 
量 之 间 的 部 分 相关 性 最 小 的 变量 第 一 个 。 移 去 第 一 个 变量 之 后 ， 会 考虑 将 下 一 个 方程 的 剩 
余 变 量 中 具有 最 小 的 部 分 相关 性 的 变量 移 去 ， 直 到 方程 中 没有 满足 消除 条 件 的 变量 ， 过 程 
才 结 束 。 

。 前 进 ， 该 方法 与 “后 退 ” 恰 好 相反 ， 是 将 自 变量 按 顺 序 选 入 到 回归 模型 中 ， 首 先 选 入 
到 方程 中 的 变量 是 与 因 变 量 之 间 具 有 最 大 相关 性 的 变量 , 同时 必须 满足 选 入 条 件 时 才 将 
它 选 入 到 方程 中 ， 然 后 考虑 下 一 个 变量 ， 直 到 没有 满足 条 件 的 变量 为 止 。 


@ 选择 变量 。 该 列表 框 主要 用 于 指定 分 析 个 案 的 选择 规则 ， 当 回归 分 析 中 包含 由 选择 规 
则 定义 的 个 案 时 ， 可 以 将 选择 变量 先入 “选择 变量 ”列表 框 中 ， 然 后 单 击 “ 规 则 ”按钮 ， 弹 出 
如 图 9-2 所 示 的 “线性 回归 : 设置 规则 ”对 话 框 。 

“线性 回归 : 设置 规则 ”对 话 框 中 的 下 拉 列 表 框 用 于 选择 关系 , 可 用 的 关系 有 “等 于 ”“ 不 
等 于 ”“ 小 于 ”“ 小 于 等 于 ”“ 大 于 ”及 “大 于 等 于 ”， 对 于 字符 串 变量 , 可 用 关系 为 “等 于 ”。 
“ 值 ”文本 框 用 于 输入 选择 按 个 案 的 具体 数值 或 字符 串 。 如 选择 “不 等 于 ”， 并 在 “ 值 ” 中 
输入 “100”， 则 只 有 那些 选 定 变量 值 不 等 于 100 的 个 案 才 会 包含 在 回归 分 析 中 。 

@@ 个 案 标签 。 该 列表 框 主要 用 于 指定 个 案 标签 的 变量 。 

@ WLS 权重 。 该 列表 框 表示 加 权 最 小 二 乘法 ， 当 判断 回归 模型 的 残 差 存在 异 方差 时 ， 才 
选用 加 权 最 小 二 乘法 ， 指 定 加 权 变 量 。 

3) 进行 相应 的 设置 。 

设置 “线性 回归 : 统计 ”对 话 杠 

单 击 “ 统 计 ” 按 钮 ， 弹 出 如 图 9-3 所 示 的 “线性 回归 ;统计 ”对 话 框 。 


司 模型 拟 合 岂 ) 

司 R 方 妆 化 量 GS) 

局 指 述 ) 

加 部 分 相关 性 和 偏 相关 性 (P) 
共 线 性 诊断 (L) 


鲜 离 笠 值 (0): 3 标准 差 
加 所 有 个 案外) 


Ee) ag Law) 

图 9-2 “线性 回归 : 设置 规则 ”对 话 框 图 9-3 “线性 回归 : 统计” 对话 杠 
“线性 回归 统计 ”对 话 框 主要 用 于 指定 线性 回归 模型 输出 的 一 些 统计 量 。 

@ “回归 系数 ”选项 组 。 该 选项 组 用 于 对 回归 系数 进行 定制 。 


。 估算 值 ， 选 中 该 复 选 框 表示 输出 回归 系数 、 标 准 误 、 标 准 化 系数 beta、t 值 及 t 的 双 尾 显著 
性 水 平 。 


212 


第 9 章 回归 分 析 


。 置信 区 间 ， 选 中 该 复 选 框 表示 输出 每 个 回归 系数 或 协 方差 矩阵 指定 置信 度 的 置信 区 间 ， 在 
“级 别 ”中 输入 范围 。 

。 协 方差 矩阵 ,选中 该 复 选 框 表示 输出 回归 系数 的 方差 - 协 方差 矩阵 ,其 对 角 线 以 外 为 协 方差， 
对 角 线 上 为 方差 ， 同 时 还 显示 相关 系数 矩阵 。 


@ “ 残 差 ” 选 项 组 。 该 选项 组 用 于 指定 对 回归 残 差 进行 检验 的 方法 。 


。 德 宾 - 沃 森 ， 选 中 该 复 选 框 表示 输出 用 于 检验 残 差 序列 自 相关 的 D-W 检验 统计 量 。 
。 个 案 诊断 ， 选 中 该 复 选 框 表 示 对 个 案 进行 诊断 并 输出 个 案 ， 其 中 ， 

> “ 离 群 值 ”表示 输出 满足 条 件 的 个 案 离 群 值 ; 

> “所 有 个 案 ” 指 可 以 输出 所 有 个 案 的 残 差 。 


@ “模型 拟 合 ” 复 选 框 。 该 复 选 框 表示 显示 输入 模型 的 变量 和 从 模型 删 去 的 变量 ， 并 显 
示 以 下 拟 合 优 度 统计 量 : 复 相关 系数 、R 方 和 调整 R 方 、 估 计 的 标准 误 及 方差 分 析 表 等 。 

田 “R 方 变化 量 ” 复 选 框 。 该 复 选 框 表 示 输 出 由 于 添加 或 删除 自 变量 而 产生 的 及 方 统计 
量 的 更 改 。 如 果 与 某 个 变量 相关 联 的 R 方 变化 很 大 ， 则 意味 着 该 变量 是 因 变量 的 一 个 良好 的 
预测 变量 。 

@ “描述 ” 复 选 框 。 该 复 选 框 表示 输出 回归 分 析 中 的 有 效 个 案 数 、 均 值 及 每 个 变量 的 标 
准 差 ， 同 时 输出 具有 单 尾 显著 性 水 平 的 相关 和 矩阵 以 及 每 个 相关 系数 的 个 案 数 。 

“部 分 相关 性 和 偏 相关 性 ” 复 选 框 。 该 复 选 框 表示 输出 部 分 相关 和 偏 相关 统计 量 。 其中， 


。 “部 分 相关 ” 指 对 于 因 变 量 与 某 个 自 变量 ， 当 已 移 去 模型 中 的 其 他 自 变量 对 该 自 变量 的 线性 
效应 之 后 ， 因 变量 与 该 自 变量 之 间 的 相关 性 。 当 变量 添加 到 方程 时 ， 它 与 及 方 的 更 改 有 关 。 
。 “ 偏 相 关 ” 指 的 是 对 于 两 个 变量 ， 在 移 去 由 于 它们 与 其 他 变量 之 间 的 相互 关联 引起 的 相关 
之 后 ， 这 两 个 变量 之 间 剩 余 的 相关 性 。 对 于 因 变 量 与 某 个 自 变 量 ， 当 已 移 去 模型 中 的 其 他 
自 变量 对 上 述 两 者 的 线性 效应 之 后 ， 这 两 者 之 间 的 相关 性 。 
@ 共 线 性 诊断 。 选 中 该 复 选 框 表 示 将 对 模型 进行 共 线 性 诊断 。 
设置 “线性 回归 : 图 ”对 话 框 
单 击 “ 图 ”按钮 ， 弹 出 如 图 9-4 所 示 的 “线性 回归 : 图 ”对 话 框 。 
“线性 回归 : 图 ”对 话 框 主要 用 于 帮助 验证 正 态 性 、 线 性 和 方差 相等 的 假设 , 还 可 以 检测 
离 群 值 、 异 常 观 察 值 和 有 影响 的 个 案 。 在 源 变量 列表 框 中 列 出 了 因 变 量 DEPENDNT 及 以 下 预 
测 变量 和 残 差 变量 : 标准 化 预测 值 (*ZPRED)、 标 准 化 残 差 (*ZRESID)、 吻 除 残 差 〈*DRESID)、 
调整 的 预测 值 (*ADJPRED) 、 学 生化 的 残 差 (*SRESID)〉 以 及 学 生化 的 已 删除 残 差 
(*SDRESID) 。 


名 散 点 图 1 的 1。 该 选项 组 可 以 利用 源 变 量 列表 框 中 的 任意 两 个 来 绘制 散 点 图 , 在 “Y” 
中 先入 YY 轴 的 变量 ， 在 “XX” 中 选 入 X 轴 的 变量 。 单 击 “ 下 一 个 ”按钮 ， 可 以 再 绘制 下 一 张 
图 ; 单 击 “ 上 一 个 ”按钮 ， 可 以 回 到 刚刚 定制 的 上 一 张 图 进行 修改 。 另 外 ， 针 对 标准 化 预测 值 
绘制 标准 化 残 差 ， 可 以 检查 线性 关系 和 等 方差 性 。 

@ 标准 化 残 差 图 。 该 选项 组 用 于 绘制 标准 化 残 差 图 ， 主 要 可 以 指定 两 种 图 : “直方 图 ” 
和 “ 正 态 概率 图 ”， 将 标准 化 残 差 的 分 布 与 正 态 分布 进 行 比较 。 
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@ 生成 所 有 局 部 图 。 该 复 选 框 表示 当 根据 其 余 自 变 量 分 别 对 两 个 变量 进行 回归 时 ， 显 示 
每 个 自 变量 残 差 和 因 变 量 残 差 的 散 点 图 。 但 是 要 求 方程 中 必须 至 少 有 两 个 自 变量 。 


设置 “线性 回归 : 保存 ”对 话 框 
单 击 “ 保 存 ” 按 钮 ， 弹 出 如 图 9-5 所 示 的 
“线性 回归 : 保存 ”对 话 框 。 


息 给 性 9: 保存 x 
3M 天 莽 
局 康信 化 yj 日 未 标准 化 y) 
回 标准 化 ER) 目 标准化 凶 
四 调 吾 后 册 加 学 生化 (S) 
三 平均 值 福 和 标准 误差 (P) 占星 疾 后 (L) 
站 学 生化 员 际 后 上 E) 
下 ni 
同 马 居中 高 t) 日 DBets 
加 库 克 拖 高 (9 占 标准 化 DIBetaC) 
加 杠杆 值 (G) ort 
-RE 同 加 标准 化 DFT 
站 下 均值) 站 单 入 日 苏 方差 比率 
置信 区 司 (G): 55 % 
T「 系 下 统计 
加 键 系数 坑 计 OO) 
时 il 圭 亲 数据 类 
数据 信 名 种 
© 写 入 新 动 据 文件 
将 模型 信息 号 出 各 XML 文件 
网 包括 苏 方差 拒 阵 CO 
Er an La | 


图 9-4 “线性 回归 : 图 ”对 话 框 


图 9-5 “线性 回归 : 保存 ”对 话 框 


“线性 回归 : 保存 ”对话 框 主要 用 于 在 活动 数据 文件 中 保存 预测 值 、 残 差 和 其 他 对 于 诊断 


有 用 的 统计 量 ， 包 括 : 


@“ 预 测 值 ” 选 项 组 。 该 选项 组 用 于 保存 回归 模型 对 每 个 个 案 预测 的 值 。 


。 未 标准 化 ， 选 中 该 复 选 框 表 示 保存 回归 模型 对 因 变 量 的 预测 值 。 

。 标准 化 ， 选 中 该 复 选 框 表示 保存 标准 化 后 的 预测 值 。 

。 调整 后 ， 选 中 该 复 选 框 表示 保存 当 某 个 案 从 回归 系数 的 计算 中 排除 时 个 案 的 预测 值 。 
。 平均 值 预测 标准 误差 ， 选 中 该 复 选 框 表示 保存 预测 值 的 标准 误 。 

@@“ 残 差 ”选项 组 。 该 选项 组 用 于 保存 回归 模型 的 残 差 。 


。 未 标准 化 ， 选 中 该 复 选 框 表示 保存 观察 值 与 模型 预测 值 之 间 的 原始 残 差 。 

。 标准 化 ， 选 中 该 复 选 框 表 示 保存 标准 化 后 的 残 差 ， 即 皮尔 逊 残 差 。 

。 学 生化 ， 选 中 该 复 选 框 表示 保存 学 生化 的 残 差 ， 即 残 差 除 以 其 随 个 案 变化 的 标准 差 的 估 
计 ， 这 取决 于 每 个 个 案 的 自 变量 值 与 自 变量 均值 之 间 的 距离 。 

。 删除 后 ， 选 中 该 复 选 框 表示 保存 当 某 个 案 从 回归 系数 的 计算 中 排除 时 该 个 案 的 残 差 ， 


它 是 因 变 量 的 值 和 调整 预测 值 之 间 的 差 。 


。 学 生化 删除 后 ， 选 中 该 复 选 框 表示 保存 学 生化 的 删除 残 差 ， 即 个 案 的 剔除 残 差 除 以 其 标 


准 误 。 
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@@ “距离 ”选项 组 。 该 选项 组 用 于 标识 自 变量 的 值 具有 异常 组 合 的 个 案 及 可 能 对 回归 模 
型 产生 很 大 影响 的 个 案 的 测量 。 


。 马 氏 距离 ， 表 示 自 变量 上 个 案 的 值 与 所 有 个 案 的 平均 值 相 异 程度 的 测量 ， 大 的 马 氏 距 
离 表示 个 案 在 一 个 或 多 个 自 变量 上 具有 极 值 。 

。 库 克 距离 ， 选 中 该 复 选 框 表示 保存 库 克 距离 值 ， 较 大 的 库 克 距离 表明 从 回归 统计 量 的 计 
算 中 排除 个 案 之 后 ， 系 数 会 发 生 很 大 变化 。 

。 杠杆 值 ， 选 中 该 复 选 框 即 表示 保存 杠杆 值 ， 杠 杆 值 是 度量 某 个 点 对 回归 拟 合 的 影响 ， 范 
围 从 0 到 QN - IN， 其 中 0 表示 对 回归 拟 合 无 影响 。 


@“ 影 响 统计 ”选项 组 ,该 选项 组 用 于 测度 由 于 排除 了 特定 个 案 而 导致 的 回归 系数 (DfBeta) 
和 预测 值 (DfFit) 的 变化 。 


DfBeta， 即 计算 beta 值 的 差分 ， 表 示 由 于 排除 了 某 个 特定 个 案 而 导致 的 回归 系数 的 改变 。 
标准 化 DfBeta， 该 复 选 框 表示 计算 beta 值 的 标准 化 差分 。 

DfFit, 表示 计算 拟 合 值 的 差分 , 即 由 于 排除 了 某 个 特定 个 案 而 产生 的 预测 变量 的 更 改 。 
标准 化 DfFit， 该 复 选 框 表示 计算 拟 合 值 的 标准 化 差分 。 

协 方差 比率 ,该 复 选 框 表示 从 回归 系数 计算 中 排除 特定 个 案 的 协 方差 矩阵 的 行列 式 与 包含 
所 有 个 案 的 协 方差 矩阵 的 行列 式 的 比率 ， 如 果 比 率 接近 1， 则 说 明 被 排除 的 个 案 不 能 显著 
改变 协 方差 矩阵 。 


@@ “预测 区 间 ” 选 项 组 。 该 选项 组 主要 用 于 设置 均值 和 

个 别 预测 区 间 的 上 界 和 下 界 。 
。 平均 值 , 该 复 选 框 表 示 保存 平均 预测 响应 的 预测 区 间 ET 
的 下 限 和 上 限 。 辟 在 方程 中 包括 芝 量 由 


| 四 &t 加 昌 : 项 x 


。 单 值 ， 该 复 选 框 表示 保存 单个 个 案 的 因 变量 预测 区 pe 
间 的 下 限 和 上 限 。 Er 
。 置信 区 间 ， 该 文本 框 用 于 指定 预测 区 间 的 范围 ， 取 
入 为 让 = 的 的 [EET ETDETD 
设置 “线性 回归 : 选项 ”对 话 框 图 9-6 “线性 回归 : 选项 ”对 话 框 


单 击 “ 选 项 ”按钮 ， 弹 出 如 图 9-6 所 示 的 “线性 回归 : 选项 ”对 话 框 。 
“线性 回归 : 选项 ”对 话 框 主 要 用 于 对 步 进 回 归 方法 和 缺失 值 进行 设置 , 各 选项 含义 如 下 。 


人 “ 步 进 法 条 件 ” 选 项 组 。 该 选项 组 在 已 指定 向 前 、 向 后 或 逐步 式 变量 选择 法 的 情况 下 
适用 。 变 量 可 以 输入 到 模型 中 ， 或 者 从 模型 中 移 去 ， 这 取决 于 下 值 的 显著 性 〈 概 率 ) 或 者 了 
值 本 身 。 


。 使 用 下 的 概率 ， 表示 如 果 变 量 的 下 值 的 显著 性 水 平 小 于 “进入 ” 值 ， 则 将 该 变量 选 入 到 模 
型 中 ， 如 果 该 显著 性 水 平 大 于 “除去 ” 值 ， 则 将 该 变量 从 模型 中 移 去 。 其 中 ，“ 进 入 ” 值 
必须 小 于 “除去 ” 值 ， 且 两 者 均 必 须 为 正 数 。 

。 使 用 下 值 , 表示 如 果 变 量 的 F 值 大 于 “进入 ” 值 , 则 该 变量 输入 模型 , 如 果 下 值 小 于 “ 除 
去 ” 值 ， 则 该 变量 从 模型 中 移 去 。“ 进 入 ” 值 必须 大 于 “除去 ” 值 ， 且 两 者 均 必 须 为 正 数 。 
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要 将 更 多 的 变量 选 入 到 模型 中 ， 请 降低 “进入 ” 值 。 要 将 更 多 的 变量 从 模型 中 移 去 ， 请 增 
大 “除去 ”的 值 。 

@ “在 方程 中 包括 常量 ” 复 选 框 。 该 复 选 框 表示 回归 模型 中 包含 常数 项 。 取 消 选择 该 复 
选 框 , 可 强制 使 回归 模型 通过 原点 , 但 是 某 些 通过 原点 的 回归 结果 无 法 与 包含 常数 的 回归 结果 
相 比较 ， 如 不 能 以 通常 的 方式 解释 及 方 。 

“缺失 值 ”选项 组 。 该 选项 组 用 于 对 回归 中 缺失 值 的 定制 ， 有 3 个 可 选项 。 


。 成 列 排除 个 案 ， 选 中 该 单 选 按钮 表示 只 有 所 有 变量 均 取 有 效 值 的 个 案 才 包含 在 分 析 中 。 
。 成 对 排除 个 案 , 选中 该 单 选 按钮 表示 使 用 正 被 相关 的 变量 对 具有 完整 数据 的 个 案 来 计算 回 
归 分 析 所 基于 的 相关 系数 。 

。 替换 为 平均 值 ， 选 中 该 单 选 按钮 表示 用 变量 的 均值 来 蔡 换 缺 省 值 。 

设置 完毕 后 ， 可 以 单 击 “ 继 续 ” 按 钮 ， 就 可 以 返回 到 “线性 回归 ”对 话 框 。 如 果 只 进行 系 
统 默认 设置 ， 可 以 单 击 “ 取 消 ”按钮 ， 也 可 以 返回 到 “线性 回归 ”对 话 框 ， 进 行 其 他 设置 。 

4) 分 析 结 果 输出 。 

设置 完毕 后 ， 单 击 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 线性 回归 分 析 的 
结果 。 


9.1.3 ”实验 操作 


下 面 将 以 “9-1” 数 据 文件 为 例 ， 讲 解 线性 回归 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 
1. 实验 数据 描述 


数据 文件 “9-1” 选 取 了 从 1978 年 一 2008 年 山东 省 国民 生产 总 值 与 固定 资产 投资 的 年 度 
数据 ， 数 据 来 源 于 《山东 省 统计 年 鉴 》。 下 面 将 利用 山东 省 国民 生产 总 值 作为 被 解释 变量 、 
定 资产 投资 作为 解释 变量 来 建立 线性 回归 模型 , 分 析 固 定 资产 投资 与 国民 生产 总 值 的 关系 。 该 
数据 文件 的 原始 数据 如 图 9-7 所 示 。 


图 9-7 数据 文件 “9-1” 的 原始 数据 
首先 在 SPSS 变量 视图 中 建立 变量 “国内 生产 总 值 ”和 “固定 资产 投资 ”， 如 图 9-8 所 示 。 
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起 "起 sai sm 1] - BM SPSS Statistics 二 二 


到 对 f 权重 | 名 名 
11 对 右 六 要 入 垢 入 


11 驯 右 少 拓 要 六 新 入 


图 9-8 数据 文件 “9-1” 的 变量 视图 
然后 在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 
部 分 数据 如 图 9-9 所 示 。 
[一 CE 


HE MAE) FEW HNC) WD HW BD ENG FMM RO BO WD 
辕 馈 书 | | a “6 


图 9-9 数据 文件 “9-1” 的 数据 视图 


2. 实验 操作 步骤 
有 具体 操作 步骤 如 下 : 


GE56i) 打开 “9-1” 数 据 文 件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”| “回归 ”| “线性” 命令， 打开 “线性 回归 ”对 话 框 ， 然 后 将 “GDP” 选 入 “ 因 
变量 ”列表 框 中 ， 将 “FAI” 选 入 “ 自 变量 ”列表 框 中 。 

本 3 单 击 “统计 ”按钮 ， 打 开 “ 线 性 回归 : 统计 ”对 话 框 ， 选 中 “估计 值 ”“ 模 型 拟 合 ” 
和 “ 德 宾 - 沃 森 ” 复 选 框 ， 然 后 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 。 

GE5363 单 击 “图 ”按钮 ， 打开“ 线性 回归 : 图 ”对 话 框 ， 选 中 “直方 图 ”和 “ 正 态 概 率 图 ” 
复 选 框 ， 然 后 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 。 

人 GE363 单 击 “选项 ”按钮 ， 打 开 “ 线 性 回归 : 选项 ”对 话 框 ， 选 中 “在 方程 中 包含 常量 ” 
复 选 框 ， 然 后 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 。 
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GES65 单 击 “确定 ”按钮 ， 便 可 以 得 到 线性 回归 结果 。 
3. 实验 结果 及 分 析 


在 SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 9-10~ 图 9-16 所 示 。 

9-10 给 出 了 输入 /除去 的 变量 情况 。 可 以 看 出 在 本 实验 中 采用 “输入 ”方法 选择 变量 ， 
输入 的 变量 是 “FAI”， 而 没有 变量 被 除去 。 

图 9-11 给 出 了 评价 模型 的 检验 统计 量 。 从 该 图 可 以 得 到 R、R 平方 、 调 整 后 的 R 平方 、 
标准 估计 的 误差 及 德 宾 - 活 森 统计 量 。 本 实验 中 回归 模型 调整 后 的 R 方 是 0.96， 说 明 回归 的 拟 
合 度 非常 高 ， 但 是 德 宾 - 活 森 却 只 有 0.338， 说 明 模型 残 差 存在 比较 严重 的 正 自 相关 。 


模型 摘 枫 " 
输入 /除去 的 变 评 a 
标准 估算 的 误 

模型 输入 的 变 全 除去 的 交集 方法 模型 R R 方 调整 后 R 方 其 稿 宾 - 沃 看 
1 FA 。 输入 1 980° 961 960 1385.02216 .338 

a. 因 变 量 : GDP a. 预测 变 便 ， (党 全), FAI 

b, 已 输入 所 请 求 的 所 有 变 重 。 b. 因 变 和 量 : GDP 

9-10 ”输入 /除去 的 变量 9-11 模型 摘要 


图 9-12 给 出 了 方差 分 析 的 结果 。 由 该 图 可 以 得 到 回归 部 分 的 F 值 为 693.222, 相应 的 显著 
性 值 是 0.000， 小 于 显著 水 平 0.05， 因 此 可 以 判断 由 FAI 对 GDP 解释 的 部 分 非常 显著 。 

图 9-13 给 出 了 线性 回归 模型 的 回归 系数 及 相应 的 一 些 统计 量 。 从 该 图 可 以 得 到 线性 回归 
模型 中 的 常数 和 FAI 的 系数 分 别 为 1253.705 和 1.921, 说 明 一 元 钱 的 固定 资产 投资 可 以 带 来 近 
两 元 钱 的 GDP 的 增加 ， 投 资 乘 数 比较 大 。 另 外 ， 线 性 回归 模型 中 的 常数 和 FAI 的 t 值 分 别 为 
4.107 和 26.329， 相 应 的 显著 性 值 为 0.000， 说 明 系数 非常 显著 ， 这 与 图 9-12 方差 分 析 的 结果 


十 分 一 致 。 
ANOVA® 
系数 
成 型 平方 和 自由 应 艾 方 F 显著 性 
1 MN 1329799070 1 1329799070 。 693222 000 本 标准 化 系数 标准 化 系数 
了 5371201907 29 1918285.396 模型 反光 员 全 | 总 用 性 
rr 29 1 而 凤 | 1253705 305.269 4107 000 
a 因 变 全，GDP 了 1.921 073 980 26329 000 
,观测 朗 量 ，( 帘 全 ), Fl 了 因 变 全: GDP 
9-12 ANOVA 图 9-13 系数 


图 9-14 给 出 了 一 些 残 差 的 统计 量 。 从 该 图 可 以 看 到 预测 值 、 残 差 、 标 准 预 测 值 和 标准 残 
差 的 极 小 值 、 极 大 值 等 统计 量 。 如 残 差 的 最 大 值 是 2548， 最 小 值 是 -2985， 平 均值 是 0。 


残 差 统计 ” 
最 小 值 最 大 值 平均 值 标准 偏差 个 案 数 
预测 值 1334.1292 25334.8106 5756.3797 6771.64237 30 
残 差 -2985.68970 2548.12353 00000 1360.93299 30 
标准 预测 值 -.653 2.891 000 1.000 30 
标准 残 差 -2.156 1.840 000 .983 30 


a. 国 变 草 : GDP 


9-14 ” 残 差 统计 量 


218 


第 9 章 回归 分 析 


图 9-15 给 出 了 标准 化 残 差 的 直方 图 。 该 图 是 标准 化 残 差 的 频率 分 布 直方 图 ， 从 中 可 以 看 
出 ， 尽 管 标准 化 后 的 残 差 出 现 了 右 侧 厚 尾 现象 ， 但 还 是 基本 满足 正 态 分 布 。 

图 9-16 给 出 了 标准 化 残 差 的 标准 PP 图 。 该 P-P 图 是 以 实际 观察 值 的 累计 概率 为 横 轴 ， 
以 正 态 分 布 的 累计 概率 为 纵 轴 , 如 果 样 本 数据 来 自 正 态 分 布 的 话 , 则 所 有 散 点 都 应 该 分 布 在 对 
角 线 附近 。 从 中 可 以 看 出 ， 分 布 结果 也 正 是 如 此 ,因此 可 以 判断 标准 化 的 残 差 基 本 服从 正 态 分 
布 ， 与 图 9-15 给 出 的 直观 结果 一 致 。 


直方 图 回归 标准 化 残 差 的 正 态 P-P 图 
因 变 量 : GDP 因 变 量 : GDP 


9 1 2 吗 oo 吗 
回归 标准 化 残 半 实测 累积 概率 


图 9-15 ”标准 化 残 差 的 直方 图 9-16 标准 化 残 差 的 标准 P-P 图 


9.2 ”曲线 回归 分 析 


曲线 估计 可 以 拟 合 许多 常用 的 曲线 关系 ， 当 变量 之 间 存 在 可 以 使 用 这 些 曲线 描述 的 关系 
时 ， 我 们 便 可 以 使 用 曲线 回归 分 析 进 行 拟 合 。 


9.2.1 曲线 回归 分 析 的 基本 原理 


许多 情况 下 , 变量 之 间 的 关系 并 非 线性 关系 ,我 们 无 法 建立 线性 回归 模型 。 但 是 许多 模型 
可 以 通过 变量 的 转化 而 转化 为 线性 关系 ,曲线 回归 分 析 方 法 被 统计 学 家 发 展 出 来 拟 合 变量 之 间 
的 关系 ,曲线 估算 的 思想 就 是 通过 变量 蔡 换 的 方法 将 不 满足 线性 关系 的 数据 转化 为 符合 线性 回 
归 模 型 的 数据 ， 再 利用 线性 回归 进行 估计 。SPSS 24.0 的 曲线 估算 过 程 提供 了 线性 曲线 、 二 次 
项 曲线 、 复 合 曲线 、 增 长 曲线 、 对 数 曲 线 、 立 方 曲线 、S 曲线 、 指 数 曲线 、 逆 模型 、 守 函 数 模 
型 、Logistic 模型 共 11 种 曲线 回归 模型 。 同 时 ，SPSS 允许 用 户 同时 引入 多 个 非 线 性 模型 ， 最 
后 结合 分 析 的 结果 选择 相关 的 模型 。 下 面 将 对 曲线 回归 分 析 进 行 介 绍 。 


9.2.2 ”曲线 回归 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 曲线 回归 分 析 。 
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1) 在 菜单 栏 中 选择 “分 析 ”|“ 回 归 ”|“ 曲线 估算 ”命令 ， 打 开 如 图 9-17 所 示 的 “曲线 
估算 ”对 话 框 。 
| 起 hk 人生 x 


Em 


农村 人 均 R 入 (元) - 
护 丸 村 人 均 孝 育 支 十 ( 


人 有 i 委 :。。。。。。。。 网 在 访 和 中 包括 妆 里 
国 忆 wwe 


图 线性 LU) 加 二 次 (Q) 四 自 合 QW) 口 增长 4) 
日 对 数 四 日 = 次 CC) Ds 癌 指 执 (6) 
DN) RW: DLogistc 

上 限 担 


9-17 “曲线 估算 ”对 话 框 


2) 选择 变量 。 

从 源 变量 列表 框 中 选择 需要 进行 曲线 回归 分 析 的 被 解释 变量 ， 然 后 单 击 国 按 钮 将 选中 的 
变量 先入“ 因 变量 ”列表 框 中 ， 从 源 变量 列表 框 中 选择 需要 进行 曲线 回归 分 析 的 解释 变量 , 单 
击 国 按钮 将 选中 的 变量 选 入 “变量 ”列表 框 中 。 


Q@@“ 因 变量 ”列表 框 。 该 列表 框 中 的 变量 为 曲线 回归 模型 中 的 被 解释 变量 ， 数 值 类 型 为 数 
值 型 。 

@ “变量 ” 单 选 按 钮 。 选 中 该 单 选 按钮 后 ， 选 择 选 入 列表 框 中 的 变量 为 线性 回归 模型 的 
解释 变量 或 控制 变量 ,数值 类 型 一 般 为 数值 型 。 如 果 解 释 变 量 为 分 类 变量 或 定性 变量 ,， 则 可 以 
用 虚拟 变量 〈 哑 变量 ) 表示 。 此 项 为 系统 默认 选项 。 

图 “时 间 ” 单 选 按钮 。 选 中 该 单 选 按钮 后 ， 则 时 间作 为 解释 变量 选 入 曲线 回归 模型 。 

@@“ 个 案 标 签 ”列表 框 。 该 列表 框 主要 用 于 指定 个 案 标签 的 变量 , 作为 散 点 图 中 点 的 标记 。 

@ “模型 ”选项 组 。 该 选项 组 用 于 指定 用 于 回归 的 曲线 模型 ，SPSS 24.0 提供 了 11 种 曲 
线 回 归 模 型 ， 分 别 是 线性 、 二 次 、 复 合 、 增 长 、 
对 数 、 三 次 、S、 指 数 、 逆 、 究 、Logistic。 其 中 ， 
如 果 选 中 Logistic 复 选 框 ， 则 在 “上限 ”文本 框 
中 指定 模型 上 限 。 

@ “显示 ANOVA 表 ” 复 选 框 。 选 中 该 复 
选 框 表 示 输 出 方差 分 析 的 结果 。 

3) 设置 保存 。 

单 击 “保存 ”按钮 ， 弹 出 如 图 9-18 所 示 的 
“曲线 估算 : 保存 ”对 话 框 。 


起 曲线 估算 : 保存 X 


图 9-18 “曲线 估算 : 保存 ”对 话 框 
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“曲线 估算 : 保存 ”对 话 框 主要 用 于 设置 保存 残 差 及 预测 个 案 。 

中 “保存 变量 ”选项 组 。 该 选项 组 用 于 对 保存 残 差 和 预测 值 的 设置 。 选 中 “预测 值 ” 复 
选 框 ， 表 示 保 存 曲线 模型 对 因 变 量 的 预测 值 ; 选中 “ 残 差 ” 复 选 框 ， 表 示 保 存 曲线 模型 回归 的 
原始 残 差 ; 选中 “预测 区 间 ” 复 选 框 ， 表 示 保 存 预测 区 间 的 上 下 界 ， 在 “置信 区 间 ” 下 拉 列 表 
框 中 选择 置信 区 间 的 范围 。 

@ “预测 个 案 ” 选 项 组 。 该 选项 组 只 有 在 “曲线 估算 ”对 话 框 〈 图 9-17) 中 选中 了 “时 
间 ” 单 选 按钮 才 会 被 激活 ， 主 要 用 于 对 个 案 进行 预测 ， 有 两 个 单 选 按钮 可 供 选 择 。 


。 “从 估算 期 到 最 后 一 个 个 案 的 预测 ”, 选中 该 单 选 按钮 表示 保存 所 有 因 变量 个 案 的 预测 值 。 
。 “预测 范围 ”， 选 中 该 单 选 按钮 表示 保存 用 户 指定 的 预测 范围 的 预测 值 ， 在 “观测 值 ” 文 
本 框 中 输入 要 预测 的 观测 值 。 
4) 分 析 结 果 输 出 。 
设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 曲线 回归 分 析 的 
结果 。 


9.2.3 ”实验 操作 


下 面 将 以 数据 文件 “9-2” 为 例 ， 讲 解 曲线 回归 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 
1. 实验 数据 描述 


数据 文件 “9-2” 搜 集 了 我 国 从 1995 年 一 2007 年 农村 人 均 收 入 与 农村 人 均 教育 支出 的 数 
据 ， 数 据 来 源 于 《中 国 农村 统计 年 鉴 》， 利 用 曲线 回归 分 析 方法 ， 分 析 农 村 人 均 教育 支出 与 农 
村 人 均 收 入 之 间 的 关系 。 本 实验 的 原始 数据 如 图 9-19 所 示 。 


1854.22 

22036 
3138.56 
444209| 
556568 
654473 
718871 
791194 
749331 
799737 


946307 
9396.45 


图 9-19 数据 文件 “9-2” 原 始 数据 
首先 在 SPSS 变量 视图 中 建立 变量 year、x 和 y， 分 别 用 来 表示 年 份 、 农 村 人 均 收 入 和 农 
村 人 均 教 育 支出 ， 如 图 9-20 所 示 。 其 中 ， 农 村 人 均 收 入 和 农村 人 均 教 育 支出 的 单位 为 元 。 
在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ， 输 入 完毕 后 的 部 分 
数据 如 图 9-21 所 示 。 
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et ee Eh ss stati HEE 


国信 cov 攻 扫 入 -EM SPSS satiric 入 拓 守 o 
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EEC 了 EEE 
Tj 6 。 5 天 5 沽 二 RE A 
lx 数字 8 2 家 村 人 约 收 入 (- 无 CE 
dy 数字 日 2 家 桂 人均 教育 支 、 无 Wm 8 潭 右 FRE VR 
| 
er | 
6 
| 
Es 
至 本 | 
EW] 
| 
-| 
| 
| 
[Cs 
丰 
F 守 
BIN SPSS Sahshcs 外 理 焊 站 泊 结 mecege of 


1995 
1996 
37 
区 
19%9 
2000 
2001 
2002 
2003 
2004 
2005 
2006 
2007 


EE Tl 


图 9-20 数据 文件 “9-2” 的 变量 视图 
2. 实验 操作 步骤 
实验 具体 操作 步骤 如 下 : 


EE 打开 
析 ”|“ 回 


9-21 数据 文件 “9-2” 的 数据 视图 


“9-2” 数 据 文件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
归 ”| “曲线 估算 ”命令 ,打开 “曲线 估算 ”对 话 框 ， 然 后 将 Y 选 入“ 因 


变 


量 ” 列 表 框 中 ， 将 义 选 入 “变量 ”列表 框 中 。 


50 在 “曲线 估算 ”对 话 框 中 选中 “线性 ” 
按钮 ， 保 存 设置 。 
(GE363 单 击 “确定 ”按钮 ， 便 可 以 得 到 曲线 


3. 实验 结果 及 分 析 


“对 数 ” 和 “二 次 ” 复 选 框 ， 然 后 单 击 “ 继 续 ” 


回归 结果 。 


在 SPSS Statistics 查看 器 窗口 中 的 输出 结果 如 图 9-22~ 图 9-26 所 示 。 
图 9-22 给 出 了 模型 基本 情况 的 描述 。 从 该 图 中 可 以 看 到 模型 的 因 变量 和 自 变 量 名称 、 含 


有 常数 项 、 方 程 的 容 差 及 3 个 方程 的 类 型 。 


9-23 给 出 了 个 案 处 理 的 摘要 。 从 该 图 可 以 看 到 参与 曲线 回归 的 个 案 数 总 共有 15 个 ,其 


中 有 两 个 由 于 带 有 缺失 值 ， 所 以 被 排除 。 


模型 描述 
模型 名 称 MOD_1 
因 变 生 1 农村 人 均 教育 支出 
《元 ) 
方程 1 线性 
2 对 数 
3 -次 
自 变 各 农村 人 均 收入 《元 ) 
区 
全 用 于 在 图 中 标注 机 全 的 变 熏 。 未 析 
有 关 在 方程 中 竹 入 项 的 容 差 .0001 


9-22 ”模型 描述 


个 案 处 理 摘要 


个 案 数 


总 个 案 数 
排除 个 案 数 ” 


预测 的 个 案 
新 创建 的 个 案 


a. 在 分 村 中 ， 将 排除 
那些 在 任何 变量 中 
具有 缺失 值 的 个 
案 。 


图 9-23 个 案 处 理 摘要 


图 9-24 给 出 了 变量 处 理 摘要 。 从 摘要 图 中 可 以 看 到 因 变 量 和 自 变量 的 正 负 值 情况 ， 如 因 


变量 和 自 变 量 都 含有 正 值 13 个 ， 没 有 零 和 负 值 ， 
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变量 处 理 摘要 


地 的 数目 
负 值 的 数目 
缺失 值 的 数目 。 用 户 缺 失 值 


系统 评 失 值 


图 9-24 变量 处 理 摘要 


9-25 给 出 了 模型 汇总 情况 和 参数 估计 值 及 相应 的 检验 统计 量 。 可 以 看 出 ， 三 个 回归 曲 
线 模型 中 ， 拟 合 度 最 好 的 是 二 次 项 模型 (R 方 为 0.987) ， 以 下 值 来 看 ， 三 个 模型 都 比较 显著 。 
另外 ， 还 得 到 了 每 个 模型 中 常数 和 系数 的 估计 结果 。 


模型 摘要 和 参数 估算 值 


因 变 重 : 农村 人 均 教 育 支出 《元 》 
模型 摘要 参数 估算 值 
F 自由 度 1 县 其 性 常生 b1 
836 56.029 1 -284.012 119 
678 23.210 1 -3686.132 480.519 
987 382641 2 252.698 -.148 2.460E-5 
自 变 登 为 农村 人 均 收入 〈 元 ) 。 


图 9-25 ”模型 摘要 和 参数 估算 值 


图 9-26 给 出 了 三 个 曲线 模型 拟 合 曲线 及 观测 值 的 散 点 图 。 从 图 中 可 以 很 直观 地 看 出 ， 在 
三 条 曲线 模型 拟 合 的 曲线 中 ， 二 次 项 模型 拟 合 的 曲线 与 原始 观测 值 拟 合 得 最 好 。 
农村 人 人均 教育 支出 《元 》 


Ce 
一 栈 作 
一 -村 星 


0 20000 40000 eo0m so00o0 。 1000000 
农村 人 均 收入 《元 ) 


图 9-26 ”农村 人 均 收入 拟 合 图 
所 以 我 们 可 以 得 出 农村 人 均 收入 与 农村 人 均 教 育 支出 之 间 的 关系 为 : 
下 -252.698-0.148X+2.460E-SXYX 
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9.3 非 线性 回归 分 析 


非 线性 回归 分 析 适 用 于 了 解 参数 的 初始 值 或 取 值 范围 ,而 模型 又 无 法 转化 为 线性 模型 估计 
的 情况 。 


9.3.1 ” 非 线性 回归 分 析 的 基本 原理 


许多 情况 下 , 非 线 性 模型 无 法 通过 变量 变换 转化 为 线性 关系 , 这 一 类 模型 称 为 本 质 非 线 性 
模型 。 那 么 ， 对 于 非 线性 模型 ， 估 算 思 路 是 ， 首 先 估算 模型 中 参数 的 起 始 值 和 取 值 范围 ， 再 利 
用 和 迭 代 算 法 得 出 参数 的 估计 值 。 一 般 来 说 ， 非 线性 模型 在 估算 完成 参数 起 始 值 和 取 值 范围 后 ， 
常 采用 NLR 或 CNLR 算法 估计 参数 ,NLR 算法 寻找 能 使 残 差 平方 和 最 小 的 参数 估计 值 , CNLR 
算法 首先 建立 一 个 非 线 性 的 损失 函数 ， 然 后 寻找 能 最 小 化 这 个 损失 函数 的 参数 估计 值 。 

一 般 相对 于 线性 模型 ， 非 线性 模型 假设 条 件 较 少 ， 模 型 形式 多 样 化 。 因 此 ， 非 线性 回归 分 
析 方 法 被 广泛 应 用 于 数据 分 析 实 践 中 。 


9.3.2 ” 非 线 性 回归 分 析 的 SPSS 操作 


建立 或 打开 相应 数据 文件 后 ， 就 以 在 SPSS Statistics 数据 编辑 器 窗口 中 进行 非 线性 回归 分 析 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 回 归 ”|“ 非 线性 ”命令 ， 打 开 如 图 9-27 所 示 的 “ 非 线性 
回归 ”对 话 框 。 


| 起 rasae 


FE | 多 


POE. 


Ej Ea 
图 9-27 “ 非 线性 回归 ”对 话 框 


2) 选择 变量 与 设置 模型 表达 式 。 

从 源 变 量 列表 框 中 选择 参与 非 线性 回归 的 因 变量 ， 然 后 单 击 国 按钮 将 选中 的 变量 选 入 
“ 因 变 量 ” 列 表 框 中 。 

从 源 变 量 列表 框 中 选择 自 变量 ， 然 后 单 击 国 按 钮 将 选中 的 变量 先入 “模型 表达 式 ” 列 表 
框 中 ， 参 与 模型 表达 式 的 构建 ; 从 “函数 组 ”列表 框 中 选择 相应 的 函数 类 型 后 ，“ 函 数 和 特殊 


224 


第 9 章 回归 分 析 


变量 ”列表 框 中 会 显示 出 具体 的 函数 与 特殊 变量 。 用 户 可 以 选择 相应 的 函数 并 单 击 国 按钮 将 
其 选 入 “模型 表达 式 ” 列 表 框 中 参与 模型 表达 式 的 构建 ,还 可 以 利用 “模型 表达 式 ” 下 方 的 键 
盘 进 行 数字 与 符号 的 输入 ， 如 图 9-28 所 示 。 


| tEAM 
ed Te 


Ju 
Je 
En 
Er 


Ej aa 
9-28 变量 选择 与 模型 构建 


3) 进行 相应 的 设置 。 

“参数 ”设置 

单 击 “ 参 数 ”按钮 ， 弹 出 如 图 9-29 所 示 的 “ 非 线性 
回归 : 参数 ”对 话 框 。 

该 对 话 框 用 于 设置 参数 起 始 值 。 用 户 在 “名 称 ” 文 
本 框 中 输入 参数 名 称 ， 在 “开始 值 ”文本 框 中 输入 参数 
的 初始 值 ， 输 入 完毕 后 单 击 “ 添 加 ”按钮 添加 变量 。 用 


户 还 可 以 单 击 “ 更 改 ” 与 “除去 ”按钮 更 改 或 除去 设置 用 使 用 上 一 分 析 的 开始 值 (U 

好 的 变量 。 如 果 选 中 “使 用 上 一 分 析 的 开始 值 ” 复 选 框 ， EE 

在 进行 连续 的 非 线性 回归 时 ， 系 统 将 自动 以 上 一 次 的 参 

数 拟 合 值 作 为 开始 值 。 图 9-29 “ 非 线性 回归 : 参数 ”对 话 框 


“损失 函数 ”设置 

当 设 置 了 参数 的 开始 值 后 ，“ 损 失 ” 按 钮 将 被 激活 ， 单 击 “ 损 失 ” 按 钮 ， 弹 出 如 图 9-30 
所 示 的 “ 非 线性 回归 : 损失 函数 ”对 话 框 。 

该 对 话 框 用 于 定制 损失 函数 。 如 果 选 中 “ 残 差 平方 和 ” 单 选 按钮 ， 系 统 将 使 用 最 小 二 乘法 
估算 模型 并 最 小 化 残 差 平方 和 ; 如 果 选 中 “用 户 定义 的 损失 函数 ” 单 选 按钮 ， 系 统 将 最 小 化 用 
户 自 定义 的 损失 函数 。 用 户 自 定义 损失 函数 的 构建 与 模型 表达 式 的 构建 操作 方法 相同 , 在 此 不 
再 装 述 。 

“约束 ”设置 

当 设 置 了 参数 的 开始 值 后 ， 该 按钮 将 被 激活 ， 单 击 “ 约 束 ”按钮 ， 弹 出 如 图 9-31 所 示 的 
“ 非 线性 回归 : 参数 约束 ”对 话 框 。 
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国手 回电: 岳 兴 下 x 


lng) mA mn 
图 9-30 “ 非 线 性 回归 : 损失 函数 ”对 话 框 
该 对 话 框 用 于 设置 非 线性 回归 的 参数 约束 条 件 。 默认 是 “未 约束 ”， 即 不 对 参数 进行 任何 
约束 。 可 以 定义 参数 约束 ， 选 中 该 单 选 按钮 后 ， 下 方 的 表达 式 编辑 区 将 被 激活 ， 允 许 用 户 设置 
自 定义 参数 。 在 “参数 ”列表 框 中 选择 要 进行 约束 的 参数 ， 单 击 国 | 按 钮 将 其 选 入 “定义 参数 
约束 ”列表 框 ， 然 后 在 “逻辑 选项 ”下 拉 列 表 框 国志 中 选择 逻辑 运算 条 件 ， 在 “约束 值 ” 
输入 框 [_] 中 输入 自 定义 约束 ， 设 置 完 毕 后 单 击 “添加 ”按钮 添加 参数 约束 。 


办 3 加 月 : 参数 约 率 x 


图 9-31 “ 非 线性 回归 : 参数 约束 ”对 话 框 
“保存 ”设置 
单 击 “ 保 存 ” 按 钮 ， 弹 出 如 图 9-32 所 示 的 “ 非 线性 回归 : 保存 新 变量 ”对 话 框 。 
该 对 话 框 用 于 设置 非 线 性 回归 的 结果 保存 。 用 户 可 以 通过 选中 相应 的 复 选 框 将 预测 值 、 残 
差 、 导 数 和 损失 函数 值 作为 新 变量 保存 。 
“选项 ”设置 
单 击 “ 选 项 ”按钮 ， 弹 出 如 图 9-33 所 示 的 “ 非 线性 回归 : 选项 ”对 话 框 。 
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图 9-32 “ 非 线性 回归 : 保存 新 变量 ”对 话 框 图 9-33 “ 非 线性 回归 : 选项 ”对 话 框 
该 对 话 框 用 于 设置 回归 方法 的 相关 参数 。 


中 “标准 误差 的 自动 抽样 估算 ” 复 选 框 。 选 中 该 复 选 框 ， 系 统 将 使 用 原始 数据 集 重复 抽 
样 的 方法 来 估算 统计 量 的 标准 误 。 此 时 ， 我 们 只 能 使 用 序列 二 次 规划 估算 方法 。 

@ “估算 方法 ”选项 组 。 该 选项 组 用 于 设置 回归 模型 的 拟 合 方法 。 在 这 里 用 户 可 以 选择 
使 用 序列 二 次 规划 法 或 利文 贝 格 - 马 夸 特 估算 法 。 

@ “序列 二 次 规划 ”选项 组 。 该 选项 组 用 于 设置 序列 二 次 规划 法 的 相关 参数 ， 当 用 户 在 
“估算 方法 ”选项 组 中 选中 “序列 二 次 规划 ” 单 选 按钮 时 ， 该 选项 组 被 激活 。 


。 “最 大 和 迭代 次 数 ”文本 框 用 于 输入 迭代 的 最 大 次 数 。 

。 “步骤 限制 ”文本 框 用 于 输入 迭代 过 程 中 参数 向 量 的 最 大 变化 ， 如 果 迭 代 过 程 中 变化 超过 
此 量 ， 则 认为 模型 不 收敛 。 

。 “最 优 性 容 差 ”下 拉 列 表 框 用 于 设置 损失 函数 的 精确 度 。 

。 “函数 精度 ”下 拉 列 表 框 用 于 设置 拟 合 方程 的 精确 度 。 

。 “无 限 步 长 ”下 拉 列 表 框 用 于 设置 迭代 过 程 中 参数 的 最 大 变化 ， 如 果 和 迭代 过 程 中 变化 
超过 此 量 ， 则 认为 模型 不 收敛 。 


图 “利文 贝 格 - 马 夸 特 ”选项 组 。 该 选项 组 用 于 设置 利文 贝 格 - 马 夸 特 估算 法 的 相关 参数 ， 
选择 “估算 方法 ”为 “利文 贝 格 - 马 夸 特 ”时 ， 该 选项 组 被 激活 。 


。 “最 大 迭代 次 数 ”文本 框 用 于 此 输入 和 迭代 的 最 大 次 数 。 

e “平方 和 收敛 ”下 拉 列 表 框 用 于 设置 方差 的 收敛 标准 ， 当 方差 的 改变 量 小 于 定制 值 时 ， 认 
为 模型 已 经 收敛 。 

e “参数 收敛 ”下 拉 列 表 框 用 于 设置 参数 的 收敛 标准 ， 当 所 有 参数 的 改变 量 小 于 定制 值 时 ， 
认为 模型 已 经 收敛 。 

4) 分 析 结 果 输 出 。 

设置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 非 线 性 回归 分 析 

的 结果 。 


9.3.3 ”实验 操作 
下 面 将 以 数据 文件 “9-3” 为 例 ， 讲 解 非 线 性 回归 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 
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1. 实验 数据 描述 


数据 文件 “9-3” 记 录 了 21 块 试验 田中 某 种 化 肥 的 使 用 量 与 农作物 产量 的 数据 。 本 实验 将 
利用 非 线 性 回归 分 析 方法 , 分 析 该 种 化 肥 使 用 量 与 农作物 产量 之 间 的 关系 。 本 数据 文件 的 原始 
Excel 数据 文件 如 图 9-34 所 示 。 


图 9-34 数据 文件 “9-3” 原 始 数 据 


在 SPSS 变量 视图 中 建立 变量 “HF” 和 “CL” 变 量 ， 分 别 用 来 表示 化 肥 使 用 量 和 农作物 
产量 ， 如 图 9-35 所 示 。 


入 "4 sav [RS1] - IBM 5PS5 Statistics WRB | 


BB 村 莹 | 值 全 失 列 对 | 到 后 色 | | 
化 蝎 使 用 里 无 无 6 届 右 仿 标 度 输入 


洗 右 伊奈 介 、 输入 


IEBM SPSS Statstcs 处 一 程序 流 络 Unicooe ON 
9-35 ”数据 文件 “9-3” 的 变量 视图 


然后 在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 
部 分 数据 如 图 9-36 所 示 。 


2. 实验 操作 步骤 
本 实验 的 具体 操作 步骤 如 下 : 
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起 "Gsav 栈 且 要 1] -1M SPSS Statistics 区 到 且 至 = 下 xX 
文才 日 ” 册 得 加 再 在 W。 夫 尖 DD) 二 术 (D 分 析 的 让 的 M) 国 和 (6) 夫 风 生气 WD 扩展 CD 大) 


i Pa 3 LE SN 


BM SPSS Sxatstcs 处 进程 外 堵 ”|Unicooe ON 


图 9-36 数据 文件 “9-3” 的 数据 视图 
人 GE56) 在 菜单 栏 中 选择 “分 析 ”|“ 回 归 ”|“ 非 线性 ”命令 ， 打 开 “ 非 线性 回归 ”对 话 框 。 
人 GE562 从 源 变 量 列表 框 中 选择 “CL” 变 量 ， 然 后 单 击 国 按 钮 将 它们 选 入 “ 因 变 量 ” 列 表 杠 
中 ， 设 置 模型 表达 式 为 atb * EXP(c*HF)。 
GE563 单 击 “ 参 数 ” 按 钮 ， 弹 出 “ 非 线 性 回归 : 参数 ”对 话 框 ， 设 置 参数 的 开始 值 a=13、 
b=-6.5、c=-1.5 (通过 两 变量 的 散 点 图 看 出 )。 
人 ES63 单 击 “ 保 存 ” 按 钮 ， 在 弹出 的 “ 非 线性 回归 : 保存 ”对 话 框 中 选中 “ 残 差 ” 复 选 框 ， 
单 击 “ 继 续 ” 按 钮 。 
(GE565 单 击 “ 确 定 ” 按 钮 ， 便 可 以 得 到 非 线性 回归 分 析 的 结果 。 


3. 实验 结果 及 分 析 
在 SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 9-37 和 图 9-38 所 示 。 


迁 代 历史 记录 
参数 
迁 代 妨 导 。。。 残 莽 手 方 和 a b 5 
10 178264 13000 -6500 -1.500 
141 5449E*30 11928 26038 5589 
12 78170 12766 -10991 -1.012 
20 78.170 12768 10.991 -1.012 
324 7.928 12290 -14.884 -762 
30 7928 12290 -14884 -762 
341 7.355 12.660 -9.609 -473 
40 7.355 12.660 -9.609 “473 
二 6.284 13.279 -10762 -417 
5 6284 13279 -10762 -417 
§1 | 6161 13349 -10.792 -418 
6 G161 13349 -i0782 -419 
61 G161 13348 -10783 -418 
7 6161 13348 -10783 -418 
Fh} 6.161 13.348 -10.783 -418 
将 通过 数字 计算 来 霄 定 导 数 。 


了 主 过 代号 在 小 数 点 无 便 显示 。 次 选 代号 在 小 数 点 右 开导 
示 。 

b. 自 于 还 妹 殊 差 半 方 和 之 同 的 相对 沽 小便 最 多 为 SSCON = 
1.000E-8。 国 此 运行 在 15 次 模 豆 评估 和 7 次 导数 评估 后 
停止 。 


9-37 和 迭代 程序 记录 
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图 9-37 给 出 了 每 一 步 迭 代 的 记录 ,由 图 可 以 看 出 经 过 了 7 次 迭代 后 ， 模 型 达到 收敛 标 准 。 


ANOVA® 
源 平方 和 自由 度 艾 方 
参数 估算 值 参数 估算 值 相关 性 加 和 2309.329 3 769776 
95% 置信 区 同 b 残 着 6.161 18 342 
去 斤 估算 标准 误 整 下 限 上 限 蒜 正 前 若 讳 ” 2315.490 21 
a 1336 104 11161 15535 “a1.000 S01 968 E66.309 20 
b -10783 1.194 -13.292 -8.274 b 561 1.000 732 Ee i 
上 -418 156 -745 -092 上 968 732 1.000 07。 


图 9-38 参数 估算 结果 
9-38 给 出 了 参数 的 估算 值 、 标 准 误差 及 参数 估算 的 相关 系数 矩阵 和 方差 分 析 ， 从 中 可 
以 得 出 ， 该 种 化 肥 使 用 量 与 农作物 产量 之 间 的 关系 为 : 
CL=13.348 一 10.783e 4 
从 这 个 式 子 中 我 们 可 以 得 出 各 种 化 肥 使 用 量 下 的 农作物 产量 并 进行 预测 , 残 差 值 作为 一 个 
新 变量 被 保存 在 数据 文件 中 。 


9.4 Logistic 回归 分 析 


Logistic 回归 分 析 常 用 于 因 变 量 为 二 分 变量 时 的 回归 拟 合 。 


9.4.1 Logistic 回归 分 析 的 基本 原理 及 模型 


在 许多 领域 的 分 析 中 , 我 们 都 会 遇 到 因 变 量 只 能 取 二 值 的 情形 , 如 是 与 否 、 有 效 与 无 效 等 。 
对 于 这 种 问题 建立 回归 模型 时 , 通常 先 将 取 值 在 实数 范围 内 的 值 通过 Logit 变换 转化 为 目标 概 
率 值 ， 然 后 进行 回归 分 析 ， 这 就 是 Logistic 回归 。Logistic 回归 参数 的 估计 通常 采用 最 大 似 然 
法 , 最 大 似 然 法 的 基本 思想 是 先 建立 似 然 函数 与 对 数 似 然 函数 , 再 通过 使 对 数 似 然 函 数 最 大 求 
解 相 应 的 参数 值 ， 所 得 到 的 估计 值 称 为 参数 的 最 大 似 然 估计 值 。Logistic 模型 的 数学 表达 如 公 
式 (9-4) 所 示 。 


In_2 =a+Xp+e (9-4) 
1-p 
oO 


h 
其 中 ，p 为 事件 发 生 的 概率 ;a =| “2 | 为 模型 的 截 距 项 ，p = 挛 为 待 估计 参数 ; 


Or pb 
Ty Ms A 


X=| Xo to -wot | 为 解释 变量 ; 8 =| 2 | 为 误差 项 。 通 过 公式 (9-2) 可 以 看 出 ，Logistic 


Mm Te En 


模型 建立 了 事件 发 生 的 概率 和 解释 变量 之 间 的 关系 。 
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打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 


中 进行 Logistic 回归 分 析 。 站 = 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 回 归 ”|“ 二 p 国 玫 一 一 一 一 半 ， 

元 Logistic” 命 令 ,打开 如 图 9-39 所 示 的 “Logistic |? 各 RY ww ma i Ce 

回归 ”对 话 框 。 区 Ch | ws 
2) 选择 变量 。 国 
ms 


从 源 变 量 列表 框 中 选择 需要 进行 Logistic 


回归 分 析 的 被 解释 变量 ， 单 击 国 按钮 将 选中 的 mo aa 


变量 选 入 “ 因 变 量 ”列表 框 中 ， 然 后 从 源 变量 国 忆 一 一 @ 硬 
列表 框 中 选择 需要 进行 Logistic 回归 分 析 的 解 ED 
释 变 量 ， 单 击 国 按钮 将 选中 的 变量 选 入“ 协 变 ce 
量 ” 列 表 框 中 。 图 9-39 “Logistic 回归 ”对 话 框 


@ “ 因 变 量 ” 列 表 框 。 该 列表 框 中 的 变量 为 Logistic 回归 模型 中 的 被 解释 变量 ， 数 值 类 
型 为 数值 型 ， 且 必须 是 二 值 变 量 。 

@ “ 协 变量 ”列表 框 。 该 列表 的 变量 为 线性 回归 模型 的 解释 变量 或 控制 变量 ， 数 值 类 型 
一 般 为 数值 型 。 如 果 解 释 变量 为 分 类 变量 或 定性 变量 ， 则 可 以 用 虚拟 变量 〈 哑 变量 ) 表示 。 如 
果 选 择 多 个 自 变量 ， 则 可 以 将 自 变量 分 组 成 “模块 ”， 通 过 “上 一 个 ”和 “下 一 个 ”按钮 对 不 
同 的 变量 子 集 指 定 不 同 的 回归 模型 。 

@ “方法 ”下 拉 列 表 框 。 用 于 选择 线性 回归 模型 中 变量 的 输入 和 除去 方法 ， 包 括 : 


。 输入 : 选中 该 方法 表示 所 有 的 “ 协 变量 ”列表 框 中 的 变量 都 选 入 回归 模型 。 

。 向 前 : 有 条 件 的 ， 该 方法 采用 步 进 方式 选择 协 变量 ， 协 变量 选 入 回归 模型 的 标准 是 条 件 参 
数 估算 的 似 然 比 统计 量 概率 值 是 否 小 于 给 定 的 显著 水 平 。 

。 向 前 : LR, 该 方法 也 是 采用 步 进 方式 选择 协 变量 , 协 变量 选 入 回归 模型 的 标准 是 极 大 偏 似 
然 估 算 的 似 然 比 统计 量 概率 值 是 否 小 于 给 定 的 显著 水 平 。 

。 向 前 : 瓦尔 德 ， 该 方法 也 是 采用 步 进 方式 选择 协 变量 ， 协 变量 选 入 回归 模型 的 标准 是 瓦尔 
德 统计 量 概率 值 是 否 小 于 给 定 的 显著 水 平 。 

。 向 后 : 有 条 件 的 ， 该 方法 首先 将 所 有 协 变量 加 入 模型 ， 然 后 根据 条 件 参数 估算 的 似 然 比 统 
计量 概率 值 是 否 大 于 给 定 的 显著 水 平 来 删除 变量 。 

。 向 后 : LR, 该 方法 首先 将 所 有 协 变量 加 入 模型 ， 然 后 根据 极 大 偏 似 然 估 算 的 似 然 比 统计 量 
概率 值 是 否 大 于 给 定 的 显著 水 平 来 删除 变量 。 

。 向 后 : 瓦尔 德 ， 该 方法 首先 将 所 有 协 变量 加 入 模型 ， 然 后 根据 瓦尔 德 统计 量 概率 值 是 否 大 
于 给 定 的 显著 水 平 来 删除 变量 。 

由 “选择 变量 ”列表 框 。 该 列表 框 主要 用 于 指定 分 析 个 案 的 选择 规则 ， 所 有 功能 及 用 法 

与 线性 回归 分 析 中 的 “选择 变量 ”相同 ， 这 里 不 再 袭 述 。 
3) 进行 相应 的 设置 。 
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定义 分 类 变量 


框 中 选择 所 需要 的 分 类 变量 ， 然 后 单 击 圈 按 钮 一 一 一 
将 选中 的 变量 选 入 “分 类 协 变量 ”列表 框 中 。 | Bl RD) 


会 被 激活 ， 该 选项 组 用 于 选择 对 比 的 方法 。 单 


一 旦 选 定 协 变量 ，“ 分 类 ”按钮 就 会 被 激 | 得 eerreme: esss 
活 。 单 击 “ 分 类 ”按钮 ， 弹 出 如 图 9-40 所 示 的 
“Logistic 回归 : 定义 分 类 变量 ”对 话 框 。 

“Logistic 回归 : 定义 分 类 变量 ”对 话 框 主 
要 是 对 分 类 变量 进行 定制 。 在 “ 协 变量 ”列表 


分 类 协 闪 里 四 : 


击 “ 对 比 ” 下 拉 列 表 框 ， 可 以 选择 对 比 的 方法 : ”图 9-40 “Logistic 回归 : 定义 分 类 变量 ”对 话 框 


息 Logistic 国 : 保存 x 

“保存 ”设置 J 一 

单 击 “ 保 存 ”按钮 ， 将 弹出 如 图 9-41 所 示 的 “Logistic 回归 :| 要 呈 和 
保存 ”对 话 框 。 i 加 学 生化 加 


“Logistic 回归 : 保存 ”对 话 框 主要 用 于 在 活动 数据 文件 中 保 
存 预 测 值 、 残 差 和 其 他 对 于 诊断 有 用 的 统计 量 ， 包 括 ;: 


指示 灯 : 该 选项 为 系统 默认 选项 ， 表 示 与 分 类 变量 的 指数 符 对 照 。 在 “参考 类 别 ” 中 选择 
“最 后 一 个 ”或 “第 一 个 ”作为 对 比 的 基准 。 

简单 : 该 选项 表示 对 分 类 变量 各 个 水 平 与 第 一 个 水 平 或 最 后 一 个 水 平 的 均值 进行 对 比 。 在 
“参考 类 别 ” 中 选择 对 比 的 基准 。 

差 值 : 该 选项 表示 对 分 类 变量 的 各 个 水 平 都 与 前 一 个 水 平 进行 做 差 比较 ， 当 然 第 一 个 水 平 
除外 。 

替 尔 默 特 : 该 选项 表示 对 分 类 变量 的 各 个 水 平 都 与 后 面 的 水 平 进行 做 差 比较 ， 当 然 最 后 一 
个 水 平 除外 。 

重复 : 该 选项 表示 对 分 类 变量 的 各 个 水 平 进行 重复 对 比 。 

多 项 式 : 该 选项 表示 对 每 个 水 平 按 分 类 变量 顺序 进行 趋势 分 析 。 常用 的 趋势 分 析 方法 有 线 
性 、 二 次 式 等 。 

偏差 : 该 选项 表示 分 类 变量 每 个 水 平 与 总 平均 值 进行 对 比 。 在 “参考 类 别 ” 中 选择 “最 后 
一 个 ”或 “第 一 个 ”作为 对 比 的 基准 。 


月 库 克 中 高 CCD) 巴 标准 化 (0) 
加 杠杆 值 L) | | 加 傅 差 AD) 


将 本 型 信息 导出 到 XML 文 件 一 一 一 


中 “预测 值 ” 选项 组 。 该 选项 组 用 于 保存 回归 模型 对 每 个 个 案 Ez 
预测 的 值 。 图 包括 协 方差 扰 珀 () 
BO) Cn a 
。 概率 ， 选 中 该 复 选 框 表示 保存 每 个 观察 值 的 预测 概率 。 
。 组 成 员 , 选中 该 复 选 框 表示 保存 根据 每 个 观察 值 的 预测 概率 所 ”图 9-41 “Logistic 回归 ; 
确定 的 组 群体 。 保存 ”对 话 框 
@@ “ 残 差 ” 选 项 组 。 该 选项 组 用 于 保存 回归 模型 的 残 差 。 
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。 分 对 数 ， 选 中 该 复 选 框 表示 保存 Logit 度量 的 残 差 。 

。 学 生化 ， 选 中 该 复 选 框 表示 保存 学 生化 的 残 差 ， 即 残 差 除 以 其 随 个案 变 化 的 标准 差 的 估 
算 ， 这 取决 于 每 个 个 案 的 自 变量 值 与 自 变量 均值 之 间 的 距离 。 

。 标准 化 ， 选 中 该 复 选 框 表示 保存 标准 化 后 的 残 差 ， 即 皮尔 逊 残 差 。 

。 偏差 ， 选 中 该 复 选 框 表示 保存 偏差 值 。 


@ “影响 ”选项 组 。 该 选项 组 用 于 保存 可 能 对 回归 模型 产生 很 大 影响 的 个 案 度量 。 


。 库 克 距 离 , 选中 该 复 选 框 表示 保存 库 克 距离 值 ， 较 大 的 库 克 距离 表明 从 回归 统计 量 的 计算 
中 排除 个 案 之 后 ， 系 数 会 发 生 很 大 变化 。 

。 杠杆 值 ， 选 中 该 复 选 框 表示 保存 杠杆 值 ， 杠 杆 值 是 度量 某 个 点 对 回归 拟 合 的 影响 ， 杠 杆 
值 范围 从 0 到 IN- 1/N， 其 中 0 表示 对 回归 拟 合 无 影响 。 

。 DfBeta, 选中 该 复 选 框 表示 计算 beta 值 的 差分 , 表示 由 于 排除 了 某 个 特定 个 案 而 导致 的 
回归 系数 的 改变 。 


蛤 Logistic 加 BE: 选 页 x 
“选项 ”设置 a 
单 击 “选项” 按钮 ， 弹 出 如 图 9-42 所 示 的 “| 呈 sg i 
电 重 球 对 交 册 所 全 优良 四 半 代 历史 记录 由 
“Logistic 回归 : 选项 ”对 话 框 。 马 1 开关 a 
“Logistic 回归 : 选项 ”对 话 框 主要 对 统计 pa 区 


和 图 、 显 示 及 步 进 概率 进行 设置 ， 包 括 : 
中 “统计 和 图 ”选项 组 。 该 选项 组 可 以 对 


ae 分 类 分 界 信 (W: 。 [05 
输出 的 统计 和 图 进行 相应 定制 。 MA pes [Nae vege 7] 

。 分 类 图， 选中 该 复 选 框 表示 输出 因 变量 | mem 

的 观测 值 和 预测 值 的 概率 直方 图 。 [el 
。 估算 值 的 相关 性 ， 选 中 该 复 选 框 表示 输 一 

出 回归 参数 估算 值 的 相关 系数 矩阵 。 辕 各 “Tegate 国 内 : 光 珊 。 齐 活 杠 
。 霍 斯 默 - 莱 梅 肖 拟 合 优 度 ， 选 中 该 复 选 框 表示 输出 衡量 回归 模型 拟 合 度 的 霍 斯 默 - 莱 梅 肖 拟 

合 优 度 指标 。 


。 和 迭代 历史 记录 ， 选 中 该 复 选 框 表 示 输 出 参数 估算 的 迭代 历史 记录 。 
。 个 案 残 差 列表 ， 选 中 该 复 选 框 表 示 输 出 回归 后 每 个 个 案 的 原始 残 差 ， 其 中 : 


> “外 离 群 值 ” 表 示 输 出 满足 条 件 的 个 案 离 群 值 ，“ 标 准 差 ” 用 于 指定 离 群 值 满足 几 倍 
标准 差 的 条 件 。 
> “所 有 个 案 ” 指 可 以 输出 所 有 个 案 的 残 差 。 
。 Exp 的 置信 区 间 ， 选 中 该 复 选 框 表示 输出 指数 的 变动 范围 ， 输 出 范围 是 从 1 ~ 99， 系 统 默 
认为 95。 
@ “显示 ”选项 组 。 该 选项 组 用 于 定制 上 述 统 计 和 图 显示 的 时 间 。 


。 在 每 个 步 又， 选中 该 单 选 按钮 表示 每 一 步 都 要 输出 选 定 的 统计 和 图 。 
。 在 最 后 一 个 步骤 ， 选 中 该 单 选 按钮 表示 最 后 一 步 要 输出 选 定 的 统计 和 图 。 
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@@ “ 步 进 概率 ”选项 组 。 该 选项 组 用 于 定制 选择 变量 进入 或 移出 回归 模型 的 进入 或 除去 
标准 。 

。 和 进入， 该 文本 框 中 的 数值 表示 变量 输入 回归 模型 的 最 低 显著 水 平 。 

。 除去 ， 该 文本 框 中 的 数值 表示 变量 移出 回归 模型 的 最 高 显著 水 平 。 


图 “分 类 分 界 值 ”文本 框 。 该 输入 值 表示 对 预测 概率 定制 分 界 点 来 产生 分 类 表 ， 系 统 默 
认为 0.5。 

@ “最 大 从 代 次 数 ”文本 框 。 该 输入 值 表示 对 回归 模型 系数 进行 的 最 大 似 然 估 算 的 和 迭代 
次 数 ， 系 统 默认 为 50 次 。 

@ “在 模型 中 包括 常量 ” 复 选 框 。 回 归 模型 中 包含 常量 。 取 消 选择 该 复 选 框 可 强制 使 回 
归 模 型 通过 原点 ， 但 是 某 些 通过 原点 的 回归 结果 无 法 与 包含 常量 的 回归 结果 相 比 较 。 

4) 分 析 结 果 输 出 。 

设置 完毕 后 ， 单 击 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 Logistic 回归 分 
析 的 结果 


9.4.3 ”实验 操作 


下 面 将 以 数据 文件 “9-4” 为 例 ， 讲 解 Logistic 回归 分 析 的 具体 操作 过 程 并 对 结果 进行 说 
明 。 


1. 实验 数据 描述 


数据 文件 “9-4” 记 录 了 某 汽车 销售 公司 的 15 年 的 年 度 销售 量 、 累 积 利润 额 与 年 终 奖 金 的 
发 放 情况 。 其 中 , 年 终 奖金 的 发 放 情况 仅仅 记录 发 放 与 不 发 放 两 种 情况 。 本 实验 将 利用 Logistic 
回归 分 析 方 法 , 分 析 影 响 该 汽车 销售 公司 奖金 发 放 的 因素 。 本 实验 的 原始 数据 如 图 9-43 所 示 。 


| 
下 名 


器 过 see。 也- 
i 3 后 去 主攻 jiG 二 区 3 二 ek EE EE | nm- te 


de 


A hewn C deal 
销量 (万 ) 年终 蜂 。” 利 涧 黑 计 《 亿 ) 
241 2.49 


a ee 


图 9-43 数据 文件 “9-4” 原 始 数据 
在 SPSS 变量 视图 中 建立 变量 “y”“x1” 和 “x2”， 分 别 用 来 表示 年 终 奖金 的 发 放 、 年 
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度 销售 量 、 累 积 利 润 额 ， 如 图 9-44 所 示 。 其 中 ，“ 年 终 奖金 的 发 放 ” 变 量 为 二 值 变 量 ， 如 果 
该 年 度 公 司 发 放 年 终 奖金 则 取 值 为 1， 不 发 放 则 取 值 为 0。 


起 Estisa [ME] -BM SPss Statistics 交大 二 
DD = 


i 


要 [a lms|la|l yn nN | Ns 
站 车 铺 旺 信里 (无 EE 
年 区 天 洱 主 。 少 枯 度 和 入 


利 几 时 计 ( 亿 元 无 测 主 。 依 拉 朗 入 多 入 


BM SPS33 Statshcs 处 坦 和 太 叉 纺 | [Unicode ON 
9-44 ”数据 文件 “9-4” 的 变量 视图 
在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 
数据 如 图 9-45 所 示 。 


从 Em sv RE1) - NM SPSS Slatistics mm o x 


ES 豆 看 琢 捉 D 村 摘 分 析 站 0 PNG) 六 用 各 主打 枝 0 面 DQt。 需 二 td 


Er ENET 


[ .BM SPSS Sotstcs 外 天 可 这 培 | Uncode ON 


图 9-45 数据 文件 “9-4” 的 数据 视图 


2. 实验 操作 步骤 


具体 操作 步骤 如 下 : 

下” 打开 “9-4” 数 据 文件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 回 归 ”|“ 二 元 Logistic” 命 令 ， 打 开 “Logistic 回归 ”对 话 框 ， 然 后 将 “y” 
选 入 “ 因 变 量 ” 列 表 框 ， 将 “x1” 和 “x2” 选 入 “ 协 变量 ”列表 框 。 

670> 单 击 “ 选 项 ”按钮 ， 打 开 “Logistic 回归 : 选项 ”对 话 框 ， 选 中 “分 类 图 ” 复 选 框 ， 
然后 单 击 “ 继 续 ”按钮 ， 保 存 设置 。 
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人 ES63 单 击 “确定 ”按钮 ， 便 可 以 得 到 Logistic 回归 结果 。 

3. 实验 结果 及 分 析 

SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 9-46~ 图 9-54 所 示 。 

图 9-46 给 出 了 个 案 处 理 摘要 ， 从 中 可 以 看 到 参与 回归 分 析 的 样本 数据 共有 15 个 ,没有 缺 
失 案例 ， 参 与 率 为 100%。 

图 9-47 给 出 了 因 变 量 在 迭代 运算 中 的 编码 ， 从 中 可 以 看 出 因 变 量 的 内 部 编码 是 0 和 1。 


个 案 处 理 摘要 
未 加 权 个 案 数 a 个 案 数 百分比 
选 定 的 个 案 。 包括 在 分 析 中 的 个 案 数 15 1000 
缺失 个 案 数 0 0 
总 计 15 100.0 因 变 量 编码 
未 选 定 的 个 案 0 0 
原 值 内 部 值 
总 计 15 100.0 | rn 
a. 如 果 权重 处 于 生效 状态 ， 请 参阅 分 类 表 以 了 解 个 案 总 Ps 
数 。 1.00 1 
图 9-46 ”个案 处 理 摘要 9-47 ” 因 变 量 编码 


图 9-48~ 图 9-50 给 出 了 “步骤 0” 的 预测 和 运算 结果 ， 包 括 分 类 表 、 方 程 中 的 变量 和 不 在 
方程 中 的 变量 。“ 步 骤 0” 是 指 在 对 因 变 量 回归 中 


ab 
的 协 变量 仅 含有 截 距 项 ， 而 不 含 其 他 解释 变量 ， 因 tf 
此 方程 中 的 变量 只 有 常量 没有 xl 和 x2 两 个 解释 变 二 
量 。 其 中 ， 常 数 的 Wals 值 只 有 0.067， 相 应 的 概率 5 on tM 
步 旭 0 年终 奖 .00 8 0 100.0 
值 是 0.796， 可 见 非常 不 显著 。 另 外 ， 从 图 9-48 分 本 
类 表 的 预测 情况 可 以 看 出 ， 基 于 “ 步 又 0” 建立 的 SHE sa 
Logistie 回归 模型 对 不 发 放 年 终 奖 的 预测 准确 率 是 “Seei8GERe 
10096， 而 对 发 放 年 终 奖 的 准确 率 是 096。 因 此 基于 
“步骤 0” 的 回归 模型 是 不 可 靠 的 。 人 
方程 中 的 变量 
B 标准 误差 瓦 守 入 自由 度 显著 性 Exp(B) 
步 台 0 常生 ~.134 518 .067 1 .796 875 
图 9-49 方程 中 的 变量 
未 包括 在 方程 中 的 变量 
得 分 自由 度 显著 性 
步 避 0 ”变量 诛 车 销 久 销量 《万 》 496 1 481 
利润 累计 《 亿 元 ) 12.986 1 000 
总 体 撤 计 13.034 2 001 


图 9-50 不 在 方程 中 的 变量 


从 图 9-51~ 图 9-54 给 出 了 “步骤 1” 的 预测 和 运算 结果 ， 包 括 模型 系数 的 综合 检验 、 模 型 
汇总 、 分 类 表 与 方程 中 的 变量 内 容 。“ 步 又 1 ”是 指 在 对 因 变 量 回 归 中 的 协 变量 含有 常量 及 x1、 
x2 两 个 解释 变量 。 从 图 9-51 模型 系数 的 综合 检验 可 以 看 出 ，“ 步 骤 1” 和 基于 该 模块 建立 的 
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小 于 0.05 的 显著 水 平 ， 可 见 步骤 1 和 基于 该 模 


块 建立 的 模型 非常 显著 。 从 图 9-52 模型 汇总 可 以 得 到 Logistic 回归 模型 的 考区 斯 -斯 奈 尔 及 方 
和 内 戈 尔 科 及 方 的 值 分 别 为 0.749 和 1， 可 见 模型 的 拟 合 度 非常 好 。 


模型 系数 的 Omnibus 检验 
卡 方 自由 度 有 显著 性 
天 呈 人 二 天 则 20728 2 000 
20728 2 000 
模型 20.728 2 000 


9-51 ”模型 系数 的 综合 检验 


模型 摘要 
关 克 斯- 斯 厅 尔 
上 可。 -2 对 数 似 然 R 方 内 奖 尔 笠 民 方 
1 .000* .749 1.000 


a. 内 于 已 达到 最 大 进 代 次 数 ， 因 此 估算 在 第 20 次 
和 达 代 时 终止 。 找 不 到 最 终 解 。 


9-52 ”模型 摘要 


天 测 1.00 “正确 本 分 比 

步 要 1 年终 丑 。 .00 0 1000 

100 7 1000 

号 休 百 分 比 1000 

a. 分 界 值 为 .500 
图 9-53 分 类 表 
方程 中 的 变量 
B 不 尔 德 ”| 自由 应” 显 车 性 | Exp(B) 

步 台 1 。 汽车 销 晤 悄 剑 《万 ) 378 000 1 1000 1459 
利润 累 计 《 亿 元 ) 6.946 000 1 997 1038.603 
常生 -82.092 41452.056 000 1 998 000 


a. 在 步 允 1 输入 的 变 舟 ， 汽车 销 全 销 仍 《 万 ) , 利润 累计 《 亿 元 。 
图 9-54 方程 中 的 变量 
Logistic 模型 建立 了 工资 发 放 概率 与 影响 因素 之 间 的 关系 ， 即 : 


ne =-82.092 + 0.378x, +6.946x， 
-Pp 


进行 指数 变换 ， 得 


= 


l=p 
即 可 对 工资 发 放 的 概率 进行 预测 。 


-82.092+0 378x, +6.946x, 


9.5 ”有 序 回归 分 析 (Ordinal) 


如 果 因 变量 是 有 序 的 分 类 变量 ， 我 们 应 该 使 用 有 序 回归 的 分 析 方法 。 


9.5.1 有 序 回 归 分 析 的 基本 原理 


很 多 情况 下 我 们 会 遇 到 回归 分 析 中 因 变 量 有 序 的 情况 ， 如 成 绩 的 等 级 ( 优 、 良 、 中 、 差 ) 、 
贷款 的 违约 情况 〈 正 常 、 关 注 、 风 险 、 已 违约 ) 等 。 有 序 因 变量 和 离散 因 变 量 不 同 ， 在 这 些 离 
散 值 之 间 存 在 着 内 在 的 等 级 关系 。 如 果 直 接 使 用 OLS 估算 法 的 话 ， 将 会 失去 因 变 量 序数 方面 
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的 信息 而 导致 估算 的 错误 。 因此 , 统计 学 家 研究 出 有 序 回归 分 析 这 种 分 析 方法 , 我 们 可 以 通过 
SPSS 方便 地 实现 有 序 回 归 分 析 的 操作 。 


9.5.2 ”有 序 回 归 分 析 的 SPSS 操作 


件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 有 序 回归 分 析 。 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 回 归 ”|“ 有 
序 ” 命 令 ， 打 开 如 图 9-55 所 示 的 “有 序 回 归 ” 
对 话 框 。 
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打 


2) 


相应 的 数据 文件 或 者 建立 一 个 数据 文 


选择 变量 。 图 9-55 “有 序 回 归 ” 对 话 框 


从 源 变量 列表 框 中 选择 需要 进行 有 序 回 归 分 析 的 被 解释 变量 ， 单 击 国 按 钮 将 选中 的 变量 
选 入 “ 因 变 量 ” 列 表 框 中 ， 从 源 变 量 列表 框 中 选择 分 类 变量 ， 单 击 国 按 钮 将 选中 的 变量 选 入 
“因子 ”列表 框 中 ; 从 源 变 量 列表 框 中 选择 需要 进行 Ordinal 回归 分 析 的 解释 变量 ， 然 后 单 击 
国 按钮 将 选中 的 变量 选 入 “ 协 变量 ”列表 框 中 。 


3) 


“选项 ”设置 

单 击 “选项 "按钮 ,弹出 如 图 9-56 所 示 的 “有 序 回归; 
选项 ”对 话 框 。 

“有 序 回归 : 选项 ” 对 话 框 主要 用 于 对 有 序 回归 的 先 
代步 骤 、 置 信 区 间 、 奇 异性 容 差 进行 设置 ， 包 括 : 


中 
迭代 估算 的 参数 。 


“ 因 变 量 ” 列 表 框 : 该 列表 框 中 的 变量 为 Ordinal 回归 模型 中 的 被 解释 变量 ， 一 般 选 定 一 
个 有 序 变 量 作为 因 变 量 ， 可 以 是 字符 串 型 或 数值 型 ， 但 必须 对 其 取 值 进 行 升序 排列 ， 并 指 
定 最 小 值 为 第 一 个 类 别 。 

“因子 ”列表 框 : 该 列表 框 中 的 变量 为 分 类 变量 ， 因 子 变量 可 以 是 字符 型 ， 但 必须 用 连续 
整数 进行 赋值 。 

“ 协 变量 ”列表 框 : 该 列表 框 的 变量 为 Ordinal 回归 模型 的 解释 变量 或 控制 变量 ， 数 值 类 型 
一 般 为 数值 型 。 如 果 解 释 变 量 为 分 类 变量 或 定性 变量 ， 则 可 以 用 虚拟 变量 ( 哑 变 量 ) 表示 。 


进行 相应 的 设置 。 


“和 迭代 ”选项 组 。 该 选项 组 用 于 设置 有 序 回 归 的 


最 大 奖 代 次 数 ， 该 文本 框 用 于 指定 最 大 迭代 步骤 数 
目 ， 必 须 为 整数 ; 若 输入 0 值 ， 则 仅 输出 初始 值 。 
最 大 逐步 二 分 次 数 ， 该 文本 框 用 于 指定 最 大 步骤 等 ”图 9-56 “有 序 回归 : 选项 ”对 话 框 
分 值 ， 且 必须 为 整数 。 

对 数 似 然 收敛 ， 该 下 拉 列 表 框 用 于 指定 对 数 似 然 收敛 值 ， 共 有 6 个 不 同 的 指定 值 ; 如 果 对 
数 似 然 估算 中 的 绝对 或 相对 变化 小 于 该 值 ， 则 交代 会 停止。 
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。 参数 收敛 ， 该 下 拉 列 表 框 用 于 指定 参数 估算 值 的 收敛 依据 ， 共 有 6 个 不 同 的 指定 值 ; 如 果 
参数 估算 的 绝对 或 相对 变化 小 于 该 值 ， 则 和 迭代 会 停止 。 

@ “置信 区 间 ” 文 本 框 。 该 文本 框 用 于 指定 参数 估算 的 置信 区 间 ， 输 入 范围 是 0 一 99。 

@@ “Delta” 文 本 框 。 该 文本 框 用 于 指定 添加 到 零 单 元 格 频率 的 值 ， 防 止 出 现 加 大 的 估计 
偏 误 ， 输 入 范围 小 于 1 的 非 负 值 。 

图 “奇异 性 容 差 ”下 拉 列 表 框 。 该 下 拉 列 表 框 用 于 指定 奇异 性 容许 误差 值 ， 共 有 6 个 值 。 

@ “联接 ”下 拉 列 表 框 。 该 下 拉 列 表 框 用 于 指定 对 模型 累积 概率 转换 的 链接 函数 ， 共 有 
5 种 函数 选择 : 


逆 柯 西 ， 该 函数 适用 于 潜 变量 含有 较 多 极端 值 的 情况 。 

互补 双 对 数 ， 该 函数 适用 于 被 解释 变量 值 与 概率 值 一 同 增加 的 情况 。 
分 对 数 ， 该 函数 适用 于 因 变 量 为 均匀 分 布 的 情况 。 

负 双 对 数 ， 该 函数 适用 于 因 变 量 取 值 与 概率 值 相 反方 向 运动 的 情况 。 
概率 ， 该 函数 适用 于 因 变 量 为 正 态 分 布 的 情况 。 


“输出 ”设置 
单 击 “ 输 出 ”按钮 ， 弹 出 如 图 9-57 所 示 的 “有 序 回归 : 输出 ”对 话 框 。 
卜 有 序 回 归 : 输出 x 
显示 保存 的 交 量 
同 海 次 达到 以 下 步 数 打印 一 次 适 代 历史 记录 0): | 1 步 | 问 估算 响应 概率 (E) 
图 拟 合 优 度 统计 (E) 器 3 快 别 D) 
摘要 统计 (S) 日 神 类 概率) 
加 参数 估算 值 (P) 品类 别 披 车 办 
器 区 娄 估 算 值 的 新 进 相关 性 (C) 
回 多 执 估 算 值 的 新 近 协 方差 打 Epn 数 W 然 | 
加 单元 格 信息 CD 回 包括 多 项 常量 (N) 
回 平行 线 检验 (L) 日 搬 多 多 项 常量 00 
sacj an aa | 


图 9-57 “有 序 回归 : 输出 ”对 话 框 
“有 序 回归 : 输出 ”对 话 框 主要 用 于 设置 输出 的 统计 量 和 表 及 保存 变量 信息 ,各 选项 组 的 
含义 介绍 如 下 。 

@“ 显 示 ” 选 项 组 。 该 选项 组 用 于 指定 要 输出 的 统计 摘要 表 ， 有 8 个 选项 : 

。 每 次 达到 以 下 步 数 打印 一 次 迭代 历史 记录 ， 选 中 该 复 选 框 表示 打印 和 闪 代 历史 记录 ， 在 “ 步 ” 中 
输入 正 整 数值 ， 表 示 输 出 每 隔 该 值 的 迭代 历史 记录 ， 同 时 输出 第 一 步 和 最 后 一 步 的 迭代 记录 。 

。 拟 合 优 度 统计 ， 选 中 该 复 选 框 表示 输出 皮尔 示 和 卡 方 统计 量 。 

。 摘要 统计 ， 选 中 该 复 选 框 表示 输出 摘要 统计 表 。 

e 参数 估算 值 ， 选 中 该 复 选 框 表示 输出 参数 估算 表 ， 该 表 中 包括 参数 估算 值 、 标 准 误差 和 置 
信 区 间 等 。 

。 参数 估算 值 的 渐 近 相关 性 ， 选 中 该 复 选 框 表示 输出 参数 估算 值 的 相关 系数 矩阵 。 

e 参数 估算 值 的 渐 近 协 方差 ， 选中 该 复 选 框 表示 输出 参数 估算 值 的 方差 - 协 方差 矩阵 。 


239 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


。 单元 格 信息 ， 选 中 该 复 选 框 表 示 输 出 观察 值 和 期 望 值 的 频率 和 累积 频率 、 频 率 和 累积 频率 
的 皮尔 逊 残 差 、 观察 到 的 和 期 望 的 概率 及 以 协 变量 模式 表示 的 观察 到 的 和 期 望 的 每 个 响应 
类 别 的 累积 概率 。 

。 平行 线 检验 ， 选 中 该 复 选 框 表示 输出 平行 线 检验 统计 量 ， 该 检验 的 原 假设 是 位 置 参数 在 多 
个 因 变 量 水 平 上 都 相等 ， 但 该 项 仅仅 适用 于 位 置 模型 。 


@ “保存 的 变量 ”选项 组 。 该 选项 组 主要 用 于 设置 保存 变量 的 信息 。 


。 估算 响应 概率 ， 选 中 该 复 选 框 表示 保存 将 观察 值 按 因子 变量 分 类 成 响应 类 别 的 模型 估算 概 
率 ， 概 率 与 响应 类 别 的 数量 相等 。 

。 预测 类 别 ， 选 中 该 复 选 框 表示 保存 模型 的 预测 响应 分 类 。 

。 预测 类 别 概率 ， 选 中 该 复 选 框 表示 保存 模型 最 大 的 预测 响应 分 类 概率 。 

。 实际 类 别 概率 ， 选 中 该 复 选 框 表 示 保存 实际 类 别 的 响应 概率 。 

@ “打印 对 数 似 然 ” 选 项 组 。 该 选项 组 用 于 设置 输出 似 然 对 数 统计 量 。 包 含 多 项 常量 ， 
选中 该 复 选 框 表示 输出 包含 常量 的 似 然 对 数 统计 量 , 排除 多 项 常量 , 选中 该 复 选 框 则 输出 不 包 
含 常量 的 似 然 对 数 统计 量 。 

“位 置 ” 设 置 

单 击 “ 位 置 ” 按 钮 ， 弹 出 如 图 9-58 所 示 的 “有 序 回归 : 位 置 ”对 话 框 。“ 有 序 回归 : 位 
置 ”对 话 框 用 于 指定 回归 模型 中 的 效应 。 包 括 : 


趣闻 回 日 : 位 秆 x 


© 二 MO) 


ET 


图 9-58 “有 序 回归 : 位 置 ”对 话 框 
@ 主 效应 。 选 中 该 单 选 按钮 表示 采用 包含 协 变量 和 因子 的 主 效应 ， 但 不 包含 交互 效应 。 
@ 定制 。 表 示 采 用 用 户 自 定义 的 模型 。 如 果 选 中 “定制 ” 单 选 按钮 ， 则 “因子 / 协 变量 ” 
“构建 项 ”和 “位 置 模型 ”都 会 被 激活 。 
。 因子 / 协 变量 : 该 列表 框 用 于 存放 已 经 选 定 的 因子 变量 和 协 变量 。 
。 构建 项 : 选项 组 用 于 选择 模型 效应 ， 有 “ 主 效应 ” “交互 ”“ 所 有 二 阶 ”“ 所 有 三 阶 ”“ 所 
有 四 阶 ”及 “所 有 五 阶 ”。 选中 所 要 指定 的 模型 效应 ， 单 击 加 按钮 就 可 以 加 入 到 “位 置 模 
型 ”列表 框 中 。 
。 位 置 模型 : 该 列表 框 用 于 存放 用 户 选 定 的 模型 效应 。 
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4) 分 析 结果 输出 。 
设置 完毕 后 ， 单 击 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 有 序 回归 分 析 的 
结果 。 


9.5.3 ”实验 操作 


下 面 将 以 数据 文件 “9-5” 为 例 , 讲解 有 序 回 归 分 析 的 具 
体操 作 过 程 并 对 结果 进行 说 明 。 


1. 实验 数据 描述 


“9-5 ”数据 文件 记录 了 某 医院 在 开发 一 种 新 型 抗 流感 药 
品 过 程 中 对 18 位 志愿 者 给 予 的 药品 剂量 数据 及 其 反应 强度 
和 性 别 信 息 ， 本 实验 将 利用 Ordinal 回归 来 分 析 该 药品 剂量 
与 反应 强度 之 间 的 关系 。 本 数据 文件 的 原始 Excel 数据 文件 
如 图 9-59 所 示 。 

首先 在 SPSS 变量 视图 中 建立 变量 “response”“quntity” 
和 “sex”， 分 别 用 来 表示 18 位 志愿 者 反应 强度 、 给 予 的 药 
品 剂量 和 性 别 ， 如 图 9-60 所 示 。 图 9-59 数据 文件 “9-5” 原 始 数据 


起 Fs 1 eM Spss Statistics 反 浊 本 a 


BV SPSS Statstics 外 温和 了 注 绩 | JUnicodeON| | 


图 9-60 数据 文件 “9-5” 的 变量 视图 
在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 。 其 中 ，“ 反 应 强度 ” 
变量 为 有 序 变 量 ， 分 别 将 “无 ”“ 轻 度 ” 和 “重度 ”赋值 为 “0”“1” 和 “2”。“ 性 别 ” 变 量 
为 名 义 变量 ， 分 别 将 “ 男 ”“ 女 ”赋值 为 “0” 和 “1”。 输 入 完毕 后 的 部 分 数据 如 图 9-61 所 示 。 
2. 实验 操作 步骤 
有 具体 操作 步骤 如 下 : 


GES6i) 打开 数据 文件 “9-5”, 输入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 析 ” 
|“ 回 归 ”|“ 有 序 ” 命 令 ， 打 开 “有 序 回归 ”对 话 框 。 
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a cn 1] -BM SPSS Siatirics HER ET 

EC 草 D 斩 才 中 让 ENG) 次 有 了， 村 术 0 亩 De。 帮 0d) 
La WW 

二 :261 

FT TFIEFRIREEEEEEE | | 
| 0m 2 1m 
2 了 | 00 3100 100 
3 Wm 5 0 
rs 0 2600 100 
a | 0 0 0 
6 1 M0 % 
7 100 4300 % 
. 10 4200 100 
9 100 800 100 
0 600 加 
1 100 4200 00 
0 430 100 
.| 200 200 100 
| 20 S400 0 


] 200 5700 00 


[ET 
9-61 数据 文件 “9-5” 的 数据 视图 


人 GE562 将 “response” 选 入 “ 因 变 量 ”列表 框 中 ， 将 “quntity” 选 入 “因子 ”列表 框 中 ， 将 
“sex” 选 入 “ 协 变 量 ” 列 表 框 中 。 
(E3703 单 击 “ 确 定 ”按钮 ， 便 可 以 得 到 有 序 回 归 的 分 析 结果 。 


3. 实验 结果 及 分 析 


在 SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 9-62~ 图 9-66 所 示 。 
图 9-62 给 出 了 案例 处 理 摘要 结果 ， 从 中 可 以 看 出 参与 回归 分 析 的 个 案 数目 、 按 “性 别 ” 
分 类 的 个 案 比 例 及 按 “ 反 应 强度 ”分 类 的 个 案 比 例 。 


Ee 图 9-63 给 出 了 模型 拟 合 信息 ， 从 中 可 以 看 到 仅 含 
ET 截 距 项 的 对 数 似 然 值 为 37.233， 最 终 模型 的 卡 方 值 是 


37.233， 显 著 性 为 0.002， 可 见 最 终 模型 更 为 显著 。 
实验 剂 装 3 
28.00 


4300 
4500 
46.00 
4900 
5400 
5500 


5700 模型 拟 合 信息 
-0 本 时 -2 对 数 似 然 卡 广 自由 诺 有 显 车 性 
62.00 EE 
P37.233 
最 的 .000 37.233 16 002 
关联 函数 ， 分 对 数 。 
图 9-62 个 案 处 理 摘要 图 9-63 模型 拟 合 信息 


图 9-64 给 出 了 两 个 拟 合 优 度 统计 量 值 ， 皮 尔 逊 卡 方 统计 量 和 偏差 卡 方 统计 量 的 显著 性 均 
为 1.000， 因 此 接受 模型 拟 合 情 况 良好 的 原 假 设 。 
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图 9-65 给 出 了 伪 及 方 的 三 个 统计 量 结果 , 从 中 可 以 看 出 考 克 斯 -斯 奈 尔 和 内 戈 尔 科 及 麦克 
法 登 统 计量 值 分 别 为 0.888、1 和 1，3 个 及 方 统计 量 的 值 都 比较 接近 1， 可 见 模型 的 拟 合 程度 
比较 好 。 


拟 合 优 度 伪 R 方 
卡 方 自由 度 县 芳 性 考 克 斯 -斯 厅 尔 B88 
皮尔 进 000 16 1.000 内 意 尔 科 1.000 
鲁莽 000 16 1.000 麦克 法 合 1.000 
关联 未 数 ， 分 对 数 。 关联 动 数 ， 分 对 数 。 
9-64 ” 拟 合 优 度 图 9-65 伪 R 方 


9-66 给 出 了 参数 估算 值 。 从 该 图 得 到 的 瓦尔 德 统计 量 及 显著 性 水 平 可 以 看 出 本 实验 中 
的 “quntity” 变 量 在 模型 中 不 显著 ， 因 子 变量 “sex” 也 不 显著 ， 说 明 实 验 剂量 对 志愿 者 的 反 
应 强度 影响 不 显著 ， 并 且 “quntity” 变 量 的 估计 系数 为 正 ， 说 明 给 予 的 剂量 越 多 ， 志 愿 者 的 反 
应 强度 越 大 。 但 是 由 于 对 被 解释 变量 进行 了 Logit 链接 函数 的 转换 ， 所 以 很 难 直 接 对 自 变量 系 
数 估算 值 进行 严格 的 数量 解释 ， 只 能 进行 符号 的 解释 。 


95% 置信 区 风 
由 度 。 时 FR rat 
asponse= 0] -39593 -2443196 2364.010 
esponse= 100] -13782 1170.357 -2307.539 _ 22 
Sar 3676E14 634.493 -1243 584 
launtiy=23 00] -53318 1419199 -2834 896 
launtry=26.00)] -53318 1419199 2834 896 
untw=28.00) -53318 1419199 -2834 896 
fauntiy=31 00} -53318 1419199 -2834 896 
aunww=34.001 -26.595 “1266.923 -2509819 2 
aunt=38.001 -26695 1096 .591 -2175975 
launtity=42 00] -26695 1096 591 -2175975 2122 
auntw=43 00| -26.695 1266.923 -2509819 2 
auntw=45.001 53318 1554.576 3100231 2 
auntiy=46 00] -26695 1266 923 -2509 819 
quntiy=49 00] 1144E13 1390.793 -2725 905 
Runm=s400l 1241E-13 1528.689 -2996174 2 
launly=5500] 9.970E-14 1390793 -2725905 
untw=5700 1.552E-13 1528.688 -2996174 2 
launWy=s800] 1172E-13 1390.793 -2725905 272: 
quntiy=62 00] 0" 
天 联 注 艇 ， 分 村 数 。 
a 此 因数 开 余 因此 沿革 为 军 。 


9-66 ”参数 估计 值 


9.6 概率 回归 分 析 (Probit) 


概率 回归 分 析 适 用 于 对 响应 比例 与 刺激 作用 之 间 关 系 的 分 析 , 概率 回归 分 析 属 于 SPSS 中 
的 专业 统计 分 析 过 程 。 


9.6.1 概率 回归 分 析 的 基本 原理 及 模型 


概率 回归 分 析 主 要 用 于 对 刺激 与 对 该 刺激 的 反应 强度 的 分 析 , 概率 回归 分 析 属 于 SPSS 中 
的 专业 统计 分 析 过 程 。 与 有 序 回 归 一 样 , 概率 回归 也 要 求 将 取 值 在 实数 范围 内 的 值 累计 概率 函 
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数 变 换 转化 为 目标 概率 值 , 然后 进行 回归 分 析 。 常见 的 累积 概率 分 布 函数 有 分 对 数 概率 函数 和 
标准 正 态 累积 概率 函数 ， 如 公式 (9-5) 、 公 式 (9-6) 所 示 。 
logit 概率 函数 


1 


Te (MAM tp) 


标准 正 态 累积 概率 函数 


z=|e ?de 


一 般 情况 下 ， 有 序 回归 更 适用 于 从 有 计划 的 实验 中 获得 的 数据 。 
9.6.2 ”概率 回归 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 


就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 


(9-5) 


(9-6) 


中 进行 概率 回归 分 析 。 二 二 
1) 在 菜单 栏 中 选择 “分 析 ”| “回归 ”|“ 概 国王 一 一 一 i 
效 ” 5 9-67 所 示 的 “概率 » 双 移 楼 洒 度 ] 
二 打开 如 图 9-67 所 示 的 “概率 分 析 ” | Zsa 国 严 光一 一 
2) 选择 变量 。 名 [一 一 一 
Q@ 响应 频率 。 该 列表 框 中 的 变量 为 Probit i 
回归 模型 中 的 响应 变量 ,数值 类 型 为 数值 型 。 对 国 | | 
于 协 变量 的 每 个 值 , 响应 变量 频率 具有 显示 相应 we | 
响应 值 的 个 案 数 目 。 Ds 
@ 实测 值 总 数 。 该 列表 框 中 的 变量 为 总 观 CE 国 区 可 大国 医 辣 攻 国 
测 变量 , 该 变量 的 样本 个 案 数目 应 为 协 变量 具有 
这 些 值 的 个 案 的 总 数 。 图 9-67 “概率 分 析 ” 对 话 框 


行 赋值 。 一 旦 选 定 因子 变量 后 ， 


@ 因子 。 该 列表 框 中 的 变量 为 分 类 变量 ， 因 子 变量 可 以 是 字符 型 ， 但 必须 用 连续 整数 进 


“定义 范围 ”按钮 就 被 激活 。 单 击 “ 定 义 范围 ”按钮 ， 弹 出 如 


图 9-68 所 示 的 “概率 分 析 : 定义 范围 ”对 话 框 ， 在 “最 小 值 ”文本 框 中 输入 因子 变量 的 最 小 
整数 值 ， 在 “最 大 值 ”文本 框 中 输入 因子 变量 中 的 最 大 整数 值 。 
@ 协 变量 。 该 列表 框 的 变量 为 概率 回归 模型 的 解释 变量 或 控制 变量 ， 数 值 类 型 一 般 为 数 
值 型 。 如 果 解 释 变 量 为 分 类 变量 或 定性 变量 ， 则 可 以 用 虚拟 变量 〈 哑 变量 ) 表示 。 
@ 转换 。 该 下 拉 列 表 框 中 的 选项 用 于 对 协 变量 进行 函数 形式 的 转换 。 
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无 ， 该 选项 表示 不 进行 任何 形式 的 转换 ， 在 回归 中 用 协 变量 的 原始 形式 。 
对 数 底 为 10， 该 选项 表示 对 协 变量 取 对 数 转 换 ， 其 中 对 数 底 为 10。 
自然 对 数 ， 也 是 表示 对 协 变量 取 对 数 进行 转换 ， 但 对 数 底 为 e。 


@ 模型 。 该 选项 组 用 于 定制 Probit 回归 模型 的 响应 概率 算法 。 


概率 ， 选 中 该 单 选 按钮 表示 用 标准 正 态 累积 概率 函数 来 计算 响应 概率 。 
分 对 数 ， 选 中 该 单 选 按钮 表示 利用 分 对 数 模型 计算 响应 概率 。 


进行 


3) 进行 “选项 ”设置 。 
单 击 “ 选 项 ”按钮 ， 弹 出 如 图 9-69 所 示 的 “概率 
分 析 : 


选项 ”对 话 框 。 


图 9-68 “概率 分 析 : 定义 范围 ”对 话 框 


第 9 章 回归 分 析 


起 本 这 分析 : 迁 页 该 


纺 计 

| 

园 相 寺 中 位 部 (B) 

FE) 

司 信 作 信 区 彰 CO) 
使 用 异性 因子 时 用 用 3 时 大 性 水 FJ: [15 。 | 


自然 响应 硅 
加 无 GD 〇 机 所 数据 计 其 (C) 日 值 QD): 


条 件 

最 大 过 代 大 执 人 0): 
mus: Eid 
| 
CoORENEY 


图 9-69 “概率 分 析 : 选项 ”对 话 框 


“概率 分 析 : 选项 ”对 话 框 主要 用 于 对 Probit 分 析 中 的 统计 量 、 自 然 响应 频率 和 迭代 标准 


设置 。 


Q@ 统计 。 该 选项 组 用 于 设置 输出 的 模型 统计 量 。 


。 频率 ， 选 中 该 复 选 框 表示 输出 实测 值 的 频数 、 残 差 等 信息 。 
。 相对 中 位 数 ， 选 中 该 复 选 框 表示 输出 因子 变量 各 个 水 平 的 中 位 数 强度 比值 ， 以 及 95% 置 信 


区 间 和 对 数 转换 的 95% 置 信 区 间 ， 


复 选 框 不 可 用 。 


如 果 在 “概率 分 析 ” 对 话 框 中 没有 指定 因子 变量 ， 则 该 


。 平行 检验 ， 选 中 该 复 选 框 表示 输出 平行 检验 的 结果 ， 该 检验 的 原 假设 是 因子 变量 的 所 有 水 
平 具 有 相同 的 斜率 ,如 果 在 “概率 分 析 ” 对 话 框 中 没有 指定 因子 变量 , 则 该 复 选 框 不 可 用 。 

。 信仰 置信 区 间 ， 选 中 该 复 选 框 表示 输出 响应 概率 所 需 的 协 变量 取 值 的 置信 区 间 ， 在 “使 用 
异 质 性 因子 时 采用 的 显著 性 水 平 ”文本 框 中 指定 显著 水 平 。 

@ 自然 响应 率 。 该 选项 组 用 于 设置 自然 响应 频率 ， 其 表示 在 没有 任何 试验 剂量 下 得 到 一 个 

响应 的 概率 (如 果 自 然 响应 概率 为 0， 表示 响应 的 发 生 全 部 归功 于 外 生 的 刺激 或 试验 的 剂量 )。 

。 无 ， 选 中 该 单 选 按钮 表示 不 定义 任何 自然 响应 频率 。 

。 根据 数据 计算 ， 选 中 该 单 选 按钮 表示 从 样本 数据 中 估算 自然 响应 概率 。 

。 值 ， 选 中 该 单 选 按钮 表示 用 户 可 以 自行 在 文本 框 中 输入 指定 的 自然 响应 概率 值 ， 但 取 值 范 


围 必须 小 于 1。 


@ 条 件 。 该 选项 组 用 于 设置 概率 回归 的 最 大 似 然 迭 代 估算 的 参数 。 

。 最 大 迭代 次 数 ， 该 文本 框 用 于 输入 最 大 和 迭代 次 数 。 

。 步骤 限制 ， 该 下 拉 列 表 框 用 于 选择 迭代 的 步 长 ， 可 供 选 择 的 有 “.1”“.01” 和 “.001”。 
。 最 优 性 容 差 ， 该 下 拉 列 表 框 用 于 选择 最 优 容 差 。 


4) 分 析 结 果 输 出 。 


设置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 概率 回归 分 析 的 
结果 。 
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9.6.3 ”实验 操作 


下 面 将 以 数据 文件 “9-6” 为 例 ， 讲 解 概率 回归 | 中 Ee 
分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 SS 
al Ez 加 上 HFFA 


1. 实验 数据 描述 


数据 文件 “9-6” 记 录 了 某 种 农药 在 不 同 的 季节 
采用 不 同 的 浓度 进行 使 用 ， 然 后 分 别 记录 了 各 个 季节 
不 同 的 药物 浓度 和 该 浓度 下 的 有 效 实验 地 块 数量 ( 即 
响应 ) ， 本 实验 将 利用 概率 回归 分 析 方法 ， 分 析 药物 
浓度 与 反馈 响应 概率 的 关系 。 本 数据 文件 的 原始 数据 
文件 如 图 9-70 所 示 。 

首先 在 SPSS 变量 视图 中 建立 变量 “季节 ”“ 浓 
度 ” “实验 地 块 数 ” 和 “响应 ”， 分 别 用 来 表示 季 
节 、 药 物 浓度 、 实 验 地 块 数量 和 响应 数 。 其中, “ 季 | 
节 ” 变 量 为 分 类 变量 ， 分 别 将 “春季 ”“ 夏 季 ” 和 图 9.70 数据 文件 “9.6” 原始 数据 
“秋季 ”赋值 为 “1”“2” 和 “3”， 如 图 9-71 所 示 。 


| 二 mm 四 日 sov M1] -IBM SPSS Statistics 了 有 下 二 区 


gg 司 wlowlsls 四 ga sse 


淹 右 “信人 攻 代 \ 软 入 
漂 右 “AP 作 度 输入 
EL 酒 右 要 输入 
用 应 天 丰 人 全 度 输入 


BM SPSS Statistics 处 理 得 序 就 线 | |， Unicode ON | 


9-71 数据 文件 “9-6” 的 变量 视图 


在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ， 输 入 完毕 后 的 部 分 
数据 如 图 9-72 所 示 。 


2. 实验 操作 步骤 
具体 操作 步骤 如 下 : 


本 TY” 打开 “9-6” 数 据 文件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 回 归 ”|“ 概 率 ”命令 ， 打 开 “ 概 率 分 析 ” 对 话 框 。 
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起 ,ES sav 爽 可 室 1] -BM Spss Statistics 总 天 - D x 


= 于 


EE 
1 加 


了 


20 
2» 
39 
0 
655 
五 
5 
20 
25 
3 
50 
器 
加 


训 急 台 全 吕 号 夺 帮 全 电信 人 
EN- 


IBM SPSS Statstics 外 退 程 序 就 绩 “ Unicode ON 
9-72 ”数据 文件 “9-6” 的 数据 视图 
人 GE5362 将 “响应 ”变量 选 入 “响应 频率 ”列表 框 中 、 将 “季节 ” 选 入 “因子 ”列表 框 中 ， 
将 “实验 地 块 数 ” 选 入 “实测 值 总 数 ” 列 表 杠 中， 将 “浓度 ” 选 入 “ 协 变量 ”列表 
框 中 ， 然 后 单 击 “定义 范围 ”按钮 ， 打 开 “ 概 率 分 析 : 定义 范围 ”对 话 框 ， 在 该 对 
话 框 的 “最 小 值 ”文本 框 中 输入 1， 在 “最 大 值 ”文本 框 中 输入 3， 在“ 转换” 下拉 
列表 框 中 选择 “自然 对 数 ” 选 项 。 
人 GE563 单 击 “ 选 项 ”按钮 ， 打 开 “ 概 率 分 析 : 选项 ”对 话 框 ， 选 中 “平行 检验 ” 复 选 框 和 
“根据 数据 计算 ” 单 选 按钮 ， 然 后 单 击 “继续 ”按钮 ， 保 存 设置 。 
(GES363 单 击 “确定 ”按钮 ， 便 可 以 得 到 概率 回归 分 析 的 结果 。 


3. 实验 结果 及 分 析 


SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 9-73~ 图 9-80 所 示 。 

图 9-73 给 出 了 模型 的 数据 信息 , 从 中 可 以 看 到 参与 回归 的 数据 有 21 个 个 案 , 有 三 个 季节 ， 
每 个 季节 的 个 案 数 都 是 7。 

9-74 给 出 了 回归 模型 的 收敛 信息 ， 从 中 可 以 看 到 迭代 次 数 为 13 次 ， 并 找到 了 模型 的 最 
佳 解 。 


数据 信息 


有 有效 21 
已 把 绝 超出 范围 * 0 
缺失 0 
无 法 秩 行 对 数 转换 0 
响应 数 > 主体 数 0 
控制 组 0 
季节 春季 7 
槛 季 7 
的 季 7 
42. 由 于 组 值 超出 范围 ， 因 此 个 计 补 
拒绝 。 


收 敏 信息 
渤 代 次 数 | 找到 的 最 伯 角 
PROBIT 13 是 


图 9-73 数据 信息 图 9-74 收敛 信息 


247 


SPSS 统计 分 析 从 入 门 到 精通 (第 四 版 ) 


图 9-75 和 图 9-76 分 别 给 出 了 参数 估算 值 和 自然 响应 率 估算 值 的 信息 。 通 过 概率 分 析 得 到 
了 关于 药物 浓度 对 数 的 斜率 估算 值 为 1.880、 共 同 的 自然 响应 概率 估算 值 为 0.041 和 对 于 各 个 


因子 水 平 的 3 个 不 同 截 距 : -7.219、-7.631 和 -7.982。 共 同 的 斜率 意味 着 在 各 个 季节 增加 药物 浓 
度 对 响应 概率 的 影响 是 相同 的 。 
参数 估算 值 
95% 置信 区 同 
参数 估算 标准 误差 Z 显著 性 F 限 上 限 
PROBIT” 药物 浓度 1880 216 8719 .000 1457 2.303 
起 IE 下 寺 -7.219 .861 -8.384 000 -8081 -6.358 
“大 -7.631 888 -8.590 000 -8520 -6.743 
甘 和 -7.982 .928 -8.601 000 -8910 -7.054 


a. PROBIT 模型 ，PROBIT(p) = 截 距 + BX《 协 变 草 XX 使 用 底数 为 2.718 的 对 数 进行 转换 。》 
b. 对 应 二 分 组 变量 季节 。 


9-75 ”参数 估计 值 


图 9-77 给 出 了 模型 回归 的 两 个 卡 方 检验 
统计 量 值 ,皮尔 逊 拟 合 优 度 检 验 结果 是 0.916， 


接受 模型 拟 合 情况 良好 的 原 假设 .平行 检验 统 
计量 值 为 0.357， 因 此 接受 因子 变量 各 个 水 平 
下 的 概率 回归 方程 具有 相同 斜率 的 原 假设 。 
图 9-78 给 出 了 单元 格 计数 、 预 测 响应 及 
“数字 ”表示 对 个 案 进 行 编号 ， 


残 差 的 信息 。 
“主体 数 ” 表 示 


因子 变量 的 各 个 水 平分 组 ， 


自然 响应 率 估 算 值 
估算 标准 误差 
PROBIT 041 019 


a. 未 提供 控制 组 。 


图 9-76 自然 响应 率 估计 值 


何 异 质 性 因子 。 


“实测 响应 ”表示 原始 的 响应 数值 ， 


卡 方 检验 
卡 广 自由 应 ? 。 星 著 性 
PROBIT 。 皮尔 进入 合 优 度 检验 8.934 16 916° 
平行 检验 2.060 2 357 


a. 由 手 显著 性 水 平 大 于 .150， 因 此 在 置信 限度 的 计算 中 未 使 用 任 


b. 基于 单个 个 案 的 统计 与 基于 汇总 个 案 的 统计 不 同 。 


图 9-77 卡 方 检验 
“期 望 响应 ” 


表示 根据 回归 得 到 的 概率 模型 进行 预测 的 响应 结果 , “ 残 差 ”表示 原 始 的 响应 数值 与 根据 回归 
得 到 的 概率 模型 进行 预测 的 响应 结果 之 差 ,“ 概 率 ”表示 该 响应 值 在 给 定 剂量 下 发 生 的 概率 值 。 
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单元 格 计 数 和 残 差 
数字 季节 。 | 药物 涩 度 | 主体 数 。 实 基 响应 | 期望 啊 诺 | 视 逢 可 
PROBT 1 1 2708 36 2 3048 -0 .057 
2 1 2906 37 2 3509 -1500 095 
3 1| 3208| 3 7 6139 861 157 
4 1 | 34%7 36 9 10425 -1425 290 
5 1 3912 33 19 18.883 17 .572 
TI 1 4190 45 34 33978 022 755 
7 1 4317 4 41 39502 1498 823 
sl 2 2708 45 1 2079 -1079 046 
9 2 2996 37 3 2323 677 063 
10 2 3219 3 2 3637 -1637 096 
11 2 347 40 10 7206 2794 180 
12 2 3912 4 20 18312 1688 416 
13 2 4190 33 16 。 20250 。 -4250 614 
14 2 4317 37 27 25880 1120 699 
15 3 2708 43 2| 107 163 043 
1 3 2996 37 2 1846 154 050 
17 3 3219 5 3195 1805 067 
Si 3 347 45 5 | 5271 271 117 
19 3 3912 33 10 9745 255 295 
20 3 4190 引 22 24493 。 -2493 490 
a 3 4317 39 23 21735 1255 .572 
9-78 ”单元 格 计数 和 残 差 
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图 9-79 给 出 了 相对 中 位 数 强度 估算 值 及 95% 的 置信 限度 ， 从 中 可 以 看 到 因子 变量 各 个 水 
平 间 的 相对 中 位 数 强度 对 比值 及 95% 的 置信 区 间 。 如 春季 与 夏季 的 相对 中 位 数 强 度 对 比值 为 
8.03， 置 信 限 度 为 0.660 一 0.942， 没 有 超过 1。 因 此 ， 可 以 判断 春季 与 夏季 的 喷 施 效果 有 显著 
的 差异 ， 其 中 ， 春 季 能 以 较 小 的 浓度 达到 中 位 响应 概率 。 另 外 ， 在 三 个 季节 中 ， 春季 喷 施 最 具 
有 效力 。 值 得 注意 的 是 , 图 9-78 中 置信 限度 提供 的 概率 范围 并 没有 将 自然 响应 概率 计算 在 内 。 


相对 中 位 数 强 度 估算 值 

95% 置信 限度 进行 对 数 斩 只 情况 下 的 95% 置信 限度 

(0 农药 嘲 访 季节 (J) 农药 咯 语 季节 估算 FM 上 限 估算 下 限 上 由 
PROBT 1 2 803 660 942 -219 -415 -.059 
3 666 508 811 -.406 -678 -.209 
2 1 1245 1.061 1.514 219 059 415 
3 830 673 983 -.187 -396 -017 
3 2 1.205 1.017 1.485 .187 017 396 
1 1.500 1.233 1969 406 209 678 


3. 对 数 底数 = 2.718。 
图 9-79 相对 中 位 数 强度 估算 值 


图 9-80 给 出 了 概率 响应 概率 与 促销 价格 的 对 数值 构成 的 散 点 图 。 从 该 图 可 以 直观 地 看 到 
经 过 对 数 转 换 的 药物 浓度 与 响应 概率 之 间 呈 线性 关系 , 且 春 季 散 点 大 多 在 夏季 散 点 之 上 , 因此 
可 以 判断 在 相同 的 浓度 下 春季 喷 施 要 比 夏季 喷 施 效果 好 。 另 外 , 从 该 图 还 可 以 得 到 在 相同 的 价 
格 下 夏季 喷 施 要 比 秋季 喷 施 效果 好 的 结论 。 


转换 后 概率 响应 
农药 惠 旅 季 巴 
Dh 
Ou 
计 o be 
o 
o 
3 o 
要 
率 D 
o 
4 
o 
。 o 
| 5。 
y r T y T 
五 3 下 站 下 
药物 浓 庆 的 对 数 


图 9-80 ”概率 转换 响应 
9.7 ”加权 回 归 分 析 
9.7.1 加权 回 归 分 析 的 基本 原理 


随机 误差 项 具有 相同 的 方差 是 加 权 回 归 估算 的 重要 假定 之 一 。 而 对 于 回归 模型 ， 
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y=a+Xp+e 
若 出 现 Var(s,)= 避 的 情况 ， 即 对 于 不 同 的 样本 点 ， 随 机 误差 项 的 方差 不 再 是 常量 ， 而 互 不 相 
同 ， 则 认为 出 现 了 异 方差 。 
异 方差 性 会 导致 参数 估算 量 为 非 有 效 、 变 量 的 显著 性 检验 失去 意义 、 模 型 的 预测 失效 等 后 
果 。 模 型 存在 异 方差 性 ， 可 用 加 权 最 小 二 乘法 WLS) 进行 估计 。 加 权 最 小 二 乘法 是 对 原 模 
型 加 权 ， 使 之 变 成 一 个 新 的 不 存在 异 方差 性 的 模型 ， 然 后 采用 加 权 回归 方法 估算 其 参数 。 


9.7.2 ”加 权 回 归 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 加 权 回 归 分 析 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 回 归 ”|“ 权 重 估算 ”命令 ， 打 开 如 图 9-81 所 示 的 “权重 估 
算 ” 对 话 框 。 

2) 选择 变量 。 

从 源 变量 列表 框 中 选择 需要 进行 加 权 回归 分 析 的 因 变量 ， 然 后 单 击 园 按 钮 将 选中 的 变量 
选 入 “ 因 变 量 ”列表 框 中 ; 从 源 变量 列表 框 中 选择 需要 进行 加 权 回 归 分 析 的 自 变量 ， 然 后 单 击 
国 按钮 将 选中 的 变量 选 入 “ 自 变 量 ”列表 框 中 ， 如 图 9-82 所 示 。 


国语 


类 a [syle] 9 和 


of BAER bean 
从 建成 本 cosy 国 国 Sm 
建筑 炳 从 业 年 时 bea 


可 重 国 刚 蛙 : 1 权重 交 量 ) 篆 


snes, | mo Js 区 


网 在 方程 中 加 括 六 晶 (C) ao 网 在 方程 中 思拓 兴国 (C) 
[As Ej 权 权 Eso ory 
9-81 “权重 估算 ”对 话 框 9-82 ”选择 加 权 回 归 分 析 的 变量 
3) 设置 加 权 权重 。 


从 源 变 量 列表 框 中 选择 需要 进行 加 权 回归 分 析 的 因 变量 ， 然 后 单 击 国 按 钮 将 选中 的 变量 
选 入 “权重 变量 ”列表 框 中 ， 然 后 在 “ 雷 的 范围 ”文本 框 中 输入 加 权 指 数 的 初始 值 与 结束 值 ， 
在 “ 按 ” 文 本 框 中 输入 加 权 指 数 的 步 长 。 系 统 要 求 加 权 指 
数 范围 为 一 6.5 一 7.5, 且 满 足 “( 结 束 值 -初始 值 )/ 步 长 <=150” 
的 条 件 ， 权 重 为 /加 权 变量 ) 加 权 指 数 。 


4) 其 他 相应 选项 的 设置 。 ie | 
Pe 六 六 入 日 对 于 每 个 昭 值 E) 


单 击 “ 选 项 ” 按钮 ， 弹 出 如 图 9-83 所 示 的 “权重 估算 : 
选项 ”对 话 框 。 


图 9-83 “权重 估算 : 选项 ”对 话 框 
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。 “将 最 住 权重 保存 为 新 变量 ” 复 选 本 选中 该 复 先 框 ， 系 统 将 得 到 的 最 佳 权重 作为 一 个 新 
变量 保存 在 数据 文件 中 

。 “显示 ANOVA 和 估算 值 " 选项 组 : 该 选项 组 用 于 设置 方差 与 估算 值 的 输出 方式 . 选中 “对 
于 最 住 辕 " 单 选 按钮， 系统 将 只 输出 最 终 的 估算 值 与 方 关 分 析 表 ; 选中 “对 于 每 个 办 什 " 
单 选 按钮 ， 系 统 将 输出 定制 的 加 权 指数 范围 内 的 所 有 权重 的 估算 值 与 方差 分 析 表 。 

“在 方程 中 包 全 常量” 复 选 杠 

选中 该 复 选 框 ， 表 示 在 模型 中 包含 常量 。 

5) 分 析 结果 输出 。 

设置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 结果 窗口 中 得 到 加 权 回 归 分 析 的 


9.7.3 ”实验 操作 
1. 实验 数据 描述 


数据 文件 “9-7” 来 源 于 SPSS 自 带 的 数据 文件 “Mallcost”， 该 数据 文件 记录 了 商业 街 的 
建筑 成 本 和 一 些 相关 的 影响 因素 。 本 实验 利用 加 权 回归 分 析 方 法 来 分 析 影 响 商业 街 建设 成 本 的 
因素 。 本 数据 文件 的 原始 数据 如 图 9-84 所 示 。 

,加 四 -mm 加 公司 白 .J。 [要 产生 云 | - Mi| 
| 天 | 扳 和 A 央 公 区 玉生 Acrobat 
| 记忆 Arial -| - | 区 天 局 隐 :] Ey | 
|Wabd ES ES SS Lal: 


图 9-84 数据 文件 “9-7” 原 始 数据 


首先 在 SPSS 变量 视图 中 建立 变量 “sqft”“style”“year” 和 “cost”， 分 别 用 来 表示 面 
积 、 建 筑 类 型 、 建 筑 师 从 业 年 限 和 建筑 成 本 。 其 中 ，“style” 变 量 用 “1、0” 分 别 表示 “室内 ” 
和 “室外 ”， 如 图 9-85 所 示 。 

然后 在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 
部 分 数据 如 图 9-86 所 示 。 
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交加 加 Gsav [小 受 生 1 - IM SPSS Statistics 数 拓 全 各 Ee 


EC 


类 型 | 席 度 | 小 教 位 教 标签 全 识 失 列 对 齐 | 到 时 | 角色 


名 称 

i lay 8 |2 ED 无 无 8 竹 右 入 标 诺 入 六 入 
2 jsye 娄 8 2 E] {00. 室 有 -元 8 要 右 信 标 度 “输入 
3 jy 站 8 2 建议 岳 从 北 年 限 ” 无 无 8 型 右 AP 标 度 输入 
二 jcost 数字 8 2 建议 成 志 无 无 8 肚 右 少 村 度 入 入 入 
日 

B 

了 

日 

] 

加 

到 

加 

四 
| 

TT 


EM SP3S Siabstcs 处 理 得 序 上 闪 | | unicode ON | 


图 9-85 ”数据 文件 “9-7” 的 变量 视图 


内 nsav [RB 和 1] - IBM SPss Sratistics 歼 合租 由 血 


ssssssssssss 


图 9-86 数据 文件 “9-7” 的 数据 视图 
2. 实验 操作 步骤 


实验 的 具体 操作 步骤 如 下 : 

5307 在 菜单 栏 中 选择 “分 析 ”| “回归 ”|“ 权 重 估算 ”命令 ， 打 开 “权重 估算 ”对 话 框 。 

GE562 从 源 变量 列表 框 中 选择 “sqft”“style” 和 “year” 变 量 ， 单 击 固 | 按 钮 将 它们 选 入 “ 自 
变量 ”列表 框 中 ， 从 源 变量 列表 框 中 选择 “cost” 变 量 ， 单 击 国 按 钮 将 其 选 入 “ 因 变 
量 ” 列 表 框 中 。 

6503 从 源 交 量 列表 框 中 选择 “sqft” 变 量 ， 单 击 国 | 按钮 将 其 选 入 “权重 变量 ”列表 框 中 ， 
在 “ 突 的 范围 ”文本 框 中 输入 加 权 指 数 的 初始 值 与 结束 值 2 和 5， 在 “ 按 ” 文 本 框 
中 输入 加 权 指数 的 步 长 0.5。 

人 GE 单 击 “ 确 定 ”按钮 ， 便 可 以 得 到 加 权 回归 分 析 的 结果 。 
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3. 实验 结果 及 分 析 对 数 似 然 信 ， 


SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 。 ”3 00 
8 D8 a 0 模型 描述 
图 9-87 给 出 了 权重 的 相关 信息 , 从 中 可 以 看 出 4000 。 -205.563 国 变 重 
加 权 指数 为 3.5 时 ， 对 数 似 然 函数 值 最 大 ， 即 3.5 本 oy 身 变量 1 saft 
是 最 优 权重 。 和 


图 9-88 给 出 了 标准 化 后 和 未 标准 化 系数 、t 统 2&0 san 


数 最 大 化 。 


计量 和 模型 的 拟 合 优 度 等 信息 ， 我 们 可 以 看 出 模型 ” ，。 ge co ms 
拟 合 优 度 较 高 且 各 系数 均 显著 ， 这 也 证 明了 前 面 对 ee : 
加 权 指 数 的 选择 是 正确 的 。 图 9-87 权重 的 输出 
系数 
模型 摘要 未 标准 化 系数 标准 化 系数 
刀 R 863 B 标准 误差 ”Beta 。 标准 误差 t 显著 性 
R 方 745 (党 要) 53.438 16.988 3.146 003 
调整 后 R 方 724 sq 149.273 15.425 .864 .089 9.678 000 
信 算 标准 误差 46.730 style -26.533 11.086 -.218 .091 -2.393 022 
对 数 似 然 二 数值。 -205.143 year -2.209 941 -.205 087 -2.348 024 
图 9-88 ”模型 的 估计 结果 
图 9-89 给 出 了 模型 的 方差 分 析 表 ， 从 中 可 ANOVA 
以 得 到 残 差 平 方 和 、 回 归 平方 和 和 了 统计 量 等 和 自由 让 | 的 为 2 人 
网 归 229428.003 3 76476.001 35.022 000 
信 息 残 差 78612.250 36 2183.674 
通过 实验 ， 我 们 可 以 得 出 影响 建筑 成 本 的 ”- 舍 308040252 Cl 
因素 与 建筑 成 本 之 间 的 关系 ， 具 体 为 : 图 9-89 ”模型 的 方差 分 析 表 


»=53.438+149.273sgft — 26.533style — 2.209 year 


方程 的 估计 信息 均 是 经 过 加 权 后 得 到 的 信息 , 消除 了 模型 中 存在 的 异 方差 性 , 保证 了 参数 
检验 的 有 效 性 。 


98 上 机 题 


视频 文件 ，\sample\ 上 机 题 \chap09\..…. 


9.1 题目 给 出 了 X 省 交通 客运 量 与 人 均 GDP 的 数据 ， 该 数据 记录 了 从 1980 年 ~2003 年 
的 情况 。 部 分 相关 数据 如 下 表 所 示 (数据 路 径 : 视频 文件 \sample\ 上 机 题 \chap09\ 习 题 \ 第 9 章 
第 一 题 .sav) 。 
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年 份 人 均 GDP (元 ) 客运 量 ( 千 人 次 ) 
1980 402 12208 
1981 472 12682 
1982 S31 13109 
1983 611 14839 
1984 765 17309 
1985 887 19772 
1986 956 26459 
1987 1131 25209 
1988 1395 29035 


试 采用 曲线 回归 的 方法 ， 为 交通 运输 量 与 人 均 GDP 的 关系 拟 合 一 条 合适 的 曲线 。 


9.2 为 了 考察 果汁 饮料 销售 量 是 否 受 到 其 他 类 型 饮料 销售 的 影响 ， 调 查 者 调查 了 碳酸 饮 
料 销售 量 、 茶 饮料 销售 量 、 固 体 冲 泡 饮 料 销售 量 和 咖啡 类 饮料 的 销售 量 。 实 测 数据 如 下 表 所 示 
(数据 路 径 ， 视 频 文 件 \sample\ 上 机 题 \chap09\ 习 题 \ 第 9 章 第 二 题 .sav) 。 


年 份 果汁 饮料 销量 “| 碳酸 饮料 销量 | 茶 饮 料 销量 | 冲 泡 饮 料 销量 咖啡 饮料 销量 
1994 23.69 25.68 23.6 10.1 4.18 
1995 24.1 25.77 23.42 13.31 2.43 
1996 22.74 25.88 22.09 9.49 6.5 
1997 17.84 27.43 21.43 11.09 25.78 
1998 18.27 29.95 24.96 14.48 28.16 
1999 20.29 33.53 28.37 16.97 24.26 
2000 22.61 37.31 42.57 20.16 30.18 
2001 26.71 41.16 45.16 26.39 17.08 
2002 EI 45.73 52.46 27.04 Ea 
2003 30.5 049 45.3 23.08 3.88 
2004 29.63 58.82 46.8 24.46 10.53 
2005 29.69 65.28 S1.11 33.82 20.09 
2006 29.25 71.25 53.29 33.57 21.22 
2007 31.05 73.37 55.36 39.59 12.63 
2008 32.28 76.68 54 48.49 .17 


利用 线性 回归 分 析 方 法 分 析 其 他 饮料 的 销售 对 果汁 饮料 销售 的 影响 。 


9.3 ” 某 实 验 室 培 养 一 种 菌 群 研究 其 活性 ， 菌 群 活性 和 培养 天 数 的 部 分 实测 数据 如 下 表 所 
示 〔( 数 据 路 径 : 视频 文件 \sample\ 上 机 题 \chap09\ 习 题 \ 第 9 章 第 三 题 .sav) 。 


观测 编号 培养 天 数 〈 天 ) 活性 
1 2 
5 
3 加 


第 9 章 回归 分 析 


( 续 表 ) 
观测 编号 培养 天 数 〈 天 ) 活性 
4 10 
5 14 
6 19 
7 26 
8 31 
9 34 
10 38 


(1) 试 采用 曲线 回归 方法 ， 估 算 参 数 估算 值 及 相应 的 检验 统计 量 。 

(2) 试 绘制 曲线 模型 拟 合 曲线 及 实测 值 的 散 点 图 , 分 析 菌 群 活性 与 培养 天 数 之 间 的 关系 。 

9.4 ”布朗 教授 研究 了 前 列 腺 癌 是 否 转移 到 附近 淋巴 结 的 问题 , 他 观察 了 53 名 病例 并 给 出 
了 相关 的 影响 因素 ， 包 括 六 射 线 下 能 否 发 现 (0 表示 无 法 发 现 ，1 表示 可 以 发 现 ) 、 病 情 级 别 
(0 表示 平稳 ，1 表示 危重 ) 、 病 情 阶 段 (0 表示 早期 ，1 表示 中 晚期 ) 、 淋 巴结 肿 大 〈0 表示 
不 肿 大 ，1 表示 肿 大 ) 和 淋巴 液 酸度 。 部 分 实测 数据 如 下 表 所 示 〈 数 据 路 径 : 视频 文件 \sample\ 
上 机 题 \chap09\ 习 题 \ 第 9 章 第 四 题 .sav) 。 


编号 | X 射线 发 现 否 | 病情 级 别 

1 64 

63 

65 

67 

66 

65 

60 
| 


66 


clelelelelelieleleleleil-=-iele 
Il-mlelrleleliecelelnlel-=-ilele|=- 


(1) 试 采用 有 序 回归 ， 估 算 参 数 估算 值 及 相应 的 检验 统计 量 。 
(2) 试 根据 有 序 回归 分 析 结 果 ， 分 析 前 列 腺 癌 是 否 转移 与 其 影响 因素 之 间 的 关系 。 


9.5 某 医 院 就 一 种 新 药 进行 了 一 系列 测试 ， 发 现 患 者 的 反应 共有 三 种 : 无 、 轻 度 和 重度 ， 
分 别 用 “0”“1”“2” 表 示 。 收 集 的 样本 资料 中 还 包括 用 药 量 及 患者 的 性 别 。 相 关 数 据 如 下 
表 所 示 〈 数 据 路 径 : 视频 文件 \sample\ 上 机 题 \chap09\ 习 题 \ 第 9 章 第 五 题 .sav) 。 


255 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


反应 用 药 量 (g) 性 别 
0.00 23.00 1.00 
0.00 31.00 1.00 
0.00 45.00 0.00 
0.00 26.00 1.00 
0.00 28.00 1.00 
1.00 34.00 0.00 
1.00 43.00 0.00 
1.00 42.00 1.00 
1.00 38.00 1.00 
1.00 46.00 0.00 
1.00 42.00 0.00 
2.00 49.00 1.00 
2.00 62.00 1.00 
2.00 54.00 0.00 
2.00 57.00 0.00 


(1) 试 采 用 有 序 回归 ， 计 算 参 数 估算 值 及 相应 的 检验 统计 量 。 
(2) 试 根据 有 序 回归 分 析 结 果 ， 分 析 患 者 反应 状况 与 其 影响 因素 之 间 的 关系 。 
9.6 菜农 学 院 对 某 新 化 肥 在 不 同 的 季节 采用 不 同 的 化 学 元 素 浓度 进行 使 用 ， 分 别 记录 了 
各 个 季节 不 同 的 化 肥 化 学 元 素 浓度 和 该 浓度 下 的 有 效 实验 地 块 数量 ( 即 响应 ) 。 其 中 , “季节 ” 
中 的 “1”“2”“3” 分 别 表 示 春 季 、 夏 季 和 秋季 ， 而 “响应 ”表示 施肥 3 天 后 土壤 的 养分 含 
量 。 相 关 数 据 如 下 表 所 示 ( 数 据 路 径 : 视频 文件 \sample\ 上 机 题 \chap09\ 习 题 \ 第 9 章 第 六 题 .sav ) 。 
季节 


wblblblblblblbil-|l-ir-miln-il=- |- |- 
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试 利用 概率 回归 来 分 析 新 化 肥 化 学 元 素 浓度 与 反馈 响应 概率 的 关系 。 


9.7 某 大 型 建筑 咨询 公司 记录 了 各 国 摩 天 大 楼 的 建筑 成 本 和 一 些 相关 的 影响 因素 。 本 实 
验 利用 回归 分 析 方 法 来 分 析 影 响 摩天 大 楼 建设 成 本 的 因素 。“ 国 有 参股 ”中 “1” 和 “0” 分 别 
表示 国有 股份 参股 和 不 参股 ， 部 分 相关 数据 如 下 表 所 示 (数据 路 征 : 视频 文件 sample\ 上 机 题 
\ehap09\ 习 题 \ 第 9 章 第 七 题 .sav) 。 


面积 《十 万 平米 ) 国有 参股 建筑 师 年 龄 年 ) 成 本 
0.73 1.00 17.00 72.70 
1.92 0.00 20.00 440.48 
0.77 1.00 9.00 109.77 


0.65 0.00 134.47 
0.80 0.00 15.00 123.39 
1.03 1.00 [uno | 18734 
0.94 0.00 22.00 91.43 


0.72 0.00 12.00 117.37 
095 000 173.69 
049 000 112.60 


1.25 0.00 12.00 281.36 
0.88 0.00 16.00 127.29 
1.58 0.00 [laoo |2z667 
0.93 0.00 22.00 172.10 
0.68 0.00 11.00 118.32 
(1) 试 采 用 加 权 回归 方法 〈 其 中 权重 变量 为 楼 房 面积 ) ， 估 算 参数 估算 值 及 相应 的 检验 
统计 量 。 
(2) 试 利用 加 权 回归 模型 的 回归 结果 分 析 并 解释 影响 摩天 大 楼 建设 成 本 的 因素 。 
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现实 生活 中 , 我 们 经 常 要 对 某 一 问题 进行 市 场 调查 , 调查 问卷 往往 需要 被 访问 者 对 一 个 问 
题 的 多 个 选项 进行 选择 。 而 如 何 对 这 类 调查 结果 进行 数据 分 析 , 便 要 用 到 本 章 将 介绍 的 多 重 响 
应 分 析 。 


10.1 多 重 响应 概述 


多 重 响应 (Multiple Response) ， 又 称 多 选 题 ， 是 市 场 调查 研究 中 十 分 常见 的 数据 形式 。 
多 重 响应 数据 本 质 上 属于 分 类 数据 , 但 由 于 各 选项 均 是 对 同一 个 问题 的 回答 , 问题 之 间 存 在 一 
定 的 相关 ， 将 各 选项 单独 进行 分 析 并 不 恰当 。 对 多 重 响应 数据 分 析 最 常见 的 方法 是 使 用 SPSS 
中 的 “多 重 响应 ”命令 ， 通 过 定义 变量 集 的 方式 ， 对 选项 进行 简单 的 频数 分 析 和 交叉 分 析 。 

统计 软件 中 对 多 重 响应 的 标准 记录 方式 有 以 下 两 种 

(1) 多 重 二 分 法 。 对 于 多 项 选择 题 的 每 一 个 选项 看 作 一 个 变量 来 定义 。0 代表 没有 被 选 
中 ，1 代表 被 选中 。 这 样 ， 多 项 选择 题 中 有 几 个 选项 ， 就 会 变 成 有 几 个 单 选 变量 。 这 些 单 选 变 
量 的 选项 都 只 有 两 个 ， 即 0 或 1。 

(2) 多 重 分 类 法 。 多 项 选择 题 中 有 几 个 选项 就 定义 几 个 单 选 变量 。 每 个 变量 的 选项 都 一 
样 ， 都 和 多 项 选择 题 的 选项 相同 。 每 个 变量 代表 被 调查 者 的 一 次 选择 ， 即 记录 的 是 被 选中 的 选 
项 的 代码 。 很 多 情况 下 ， 当 问卷 中 不 限定 被 访 者 可 选择 的 选项 数量 时 , 被 调查 者 可 能 不 会 全 部 
选项 都 选 ,因此 在 数据 录入 时 ,一般 从 这 些 变量 的 最 前 面 几 个 变量 开始 录入 ,这 样 最 后 面 几 个 
变量 自然 就 是 缺失 值 。 当 被 调查 者 对 多 项 选择 题 中 的 选项 全 部 选择 时 , 这 些 变 量 中 都 有 一 个 选 
项 代码 ， 此 时 没有 缺失 值 。 


10.2 多重 响 应 变量 集 


在 对 数据 文件 进行 多 重 响应 分 析 之 前 , 应 该 先 将 基本 变量 转换 为 能 通过 SPSS 软件 使 用 的 
数据 类 型 ， 即 定义 为 多 重 响应 变量 集 。 


10.2.1 多重 响 应 变量 集 的 定义 


多 重 响应 集 的 定义 , 即将 基本 变量 分 组 为 多 重 二 分 类 变量 集 和 多 重 多 分 类 变量 集 , 并 转换 
为 能 通过 SPSS 软件 操作 的 数据 类 型 。 通 过 定义 后 的 数据 类 型 ， 可 以 获得 这 些 集 的 频率 表 和 交 
叉 制 表 。SPSS 可 以 定义 20 个 的 多 重 响应 集 ， 每 个 集 必须 有 一 个 唯一 的 名 称 。 

每 个 多 重 响 应 集 必须 指定 一 个 名 称 , 名 称 最 多 可 以 有 七 个 字符 。 多 重 响应 变量 集 的 定义 过 
程 将 在 用 户 指定 的 名 称 前 加 上 美元 符号 “$”， 注 意 ， 用 户 定制 的 多 重 响应 集 名 中 不 能 使 用 以 
下 保留 名 称 : casenum、sysmis、jdate、date、time、length 和 width 。 
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多 重 响应 集 的 名 称 仅 在 用 于 多 重 响应 过 程 时 存在 ， 在 其 他 过 程 中 不 能 使 用 多 重 响应 集 名 
称 。 另 外 还 可 以 输入 多 重 响应 集 的 描述 性 变量 标签 ， 标 签 最 长 可 以 有 40 个 字符 。 


10.2.2 ”定义 多 重 响应 变量 集 的 实验 操作 


下 面 将 以 “10-1” 数 据 文件 为 例 ， 讲 解 定义 多 重 响应 变量 的 具体 操作 过 程 并 对 输出 结果 进 
行 说 明 。 
1. 实验 数据 描述 


“10-1” 数据 文件 记录 了 某 次 消费 者 使 用 的 洗 发 水 品牌 调查 结果 ， 问 卷 列举 了 用 户 可 能 使 
用 的 洗 发 水 品牌 ， 包 括 “ 雨 洁 ”“ 海 飞 丝 ”“ 夏 土 节 ”“ 飘 乘 ”"“ 清 扬 ”“ 舒 荔 ”“ 潘 绊 ”“ 沙 
宣 ”8 个 品牌 及 “其 他 ”。 下 面 介绍 如 何 利用 “定义 变量 集 ”命令 定义 多 重 响 应 变量 集 “brand” 
将 这 些 品牌 包含 进去 。“10-1” 数 据 文件 的 原始 Excel 数据 如 图 10-1 所 示 。 


代 呈 


A B a | 6 再 I 
工 二 清理 尼 于 证 额 末 。 清 坊 。” 他 梧 ” 治 符 示 寺 下 他 
2 | 再 理 否 析 否 村 是 3 理 
否 是 是 否 是 是 是 是 否 
4 
5 | 否 否 否 否 否 否 至 理 理 
5 | 否 否 否 否 时 否 是 是 否 
二 和 
8 | 是 天 四 是 否 是 百 理 是 
9 | 是 是 是 是 是 是 是 是 是 
情人 二 萎 合 全 是 是 最 全 
11 | 是 理 否 天 百 百 百 否 天 
12 | 再 否 是 是 理 百 百 至 是 
村 是 本 是 是 是 ”是 区 
rs EE st st 
15 | 是 是 是 是 是 是 是 是 是 
6 | 否 否 否 否 否 百 百 百 否 
1 二 
18 | 是 否 否 否 是 是 是 是 否 
否 否 否 否 否 是 是 是 否 
EN 


图 10-1 “10-1” 数 据 文件 原始 数据 


首先 在 SPSS 变量 视图 中 建立 “ 雨 洁 ”“ 海 飞 丝 ”“ 夏 士 鞍 ”“ 飘 乘 ”“ 清 扬 ”“ 舒 一 ” 
“潘婷 ”“ 沙 宣 ”“ 其 他 ”9 个 变量 名 ， 所 有 变量 的 度量 标准 均 为 “名 义 ”， 如 图 10-2 所 示 。 


全 这 Ea M555 seatictics BS -0o x 
EE 
后 画 vp 1 站 本 忆 半 


EE | 
无 EE 
天 面议 具 纵 和 
无 病 入 入 新 入 
无 本 入 入 入 
天 高 2X 和 
于 识 和 入 坊 入 
无 六 入 攻 入 
无 六 入 条 入 
本 本 多 入 


BEIE EE IE EE 


J PSS Sabetcs 外 于 入 寺 Unicode -ON 


图 10-2 “10-1” 数 据 文件 的 变量 视图 


259 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


然后 在 SPSS 数据 视图 中 ， 把 有 关 数 据 录 入 对 应 变量 中 ， 其 中 1 代表 是 ，0 代表 否 ， 输 入 
完毕 后 的 部 分 数据 如 图 10-3 所 示 。 
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图 “二 XS 下 二 生 sav 下 和 1]- BM SPSS Statistics 禾 合 和 3 


图 10-3 “10-1” 数 据 文件 的 数据 视图 


2. 实验 操作 步骤 

GE36i 打开 “10-1” 数 据 文 件 ， 输 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 多 重 响 应 ”|“ 定 义 变量 集 ” 命 令 ， 打 开 如 图 10-4 所 示 的 “定义 多 重 响应 集 ” 
对 话 框 。 


“集合 定义 ”列表 框 : 该 列表 框 中 显示 的 是 “10-1” 数 据 文 件 中 的 所 有 变量 ， 选 
中 变量 后 单 击 右 侧 箭头 国 按 钮 将 其 选 入 “集合 中 的 变量 ”列表 框 中， 进行 多 重 
响应 变量 集 的 定义 。 

“集合 中 的 变量 ”列表 框 : 从 左 侧 的 源 变量 列表 框 中 选 入 同属 于 一 个 问题 的 多 个 
答案 变量 ， 以 定义 多 重 响应 变量 集 。 

“多 重 响应 集 ” 列 表 框 : 该 列表 框 用 于 保存 已 经 定义 好 的 多 重 响应 变量 集 ， 可 以 
通过 单 击 左 侧 的 “添加 ”“ 更 改 ”“ 除 去 ”按钮 分 别 添加 、 修 改 、 删 除 当前 指定 
的 多 重 响应 变量 集 。 

“变量 编码 方式 ”选项 组 : 该 选项 组 用 于 设置 多 重 响应 变量 集 的 编码 方式 。 若 选 
中 “二 分 法 ” 单 选 按钮 ， 则 表示 使 用 二 分 变量 的 计数 值 进行 编码 ， 即 把 每 个 多 选 
题 选 项 都 当 作 是 一 个 二 元 变量 ， 在 “计数 值 ”中 输入 1， 表示 该 选项 被 选中 ， 输 
入 0 表示 未 被 选中 ; 若 选中 “类 别 ” 单 选 按钮 ， 则 表示 使 用 分 类 变量 进行 编码 ， 
即 为 多 选 题 定制 与 其 最 多 答案 个 数 相 等 的 单 选 变量 , 每 个 单 选 变量 的 可 能 取 值 都 
和 多 选 题 的 可 选项 相同 ， 它 代表 被 选中 的 多 选 题 选 项 的 代码 ，“ 范 围 ”文本 框 用 
于 设置 可 选 答案 代码 的 起 点 和 终点 。 

“名 称 ” 文 本 框 : 用 于 定制 当前 多 重 响应 变量 集 的 名 称 ， 系统 将 自动 在 定制 的 名 
称 前 加 上 “$” 符 号 。 

“标签 ”文本 框 : 用 于 设置 当前 响应 变量 的 标签 。 
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小 


注 : 此 处 定义 的 集合 仅 在 多重 啊 应 频 奉 "和 "多重 啊 应 交叉 表 "过程 中 可 用 。 对 于 要 在 其 他 位 置 鞭 用 
的 蘑 合 , 请 使 用 "数据 菜单 中 的 定义 多 重 响应 集 " 


[EDIE 
图 10-4 “定义 多 重 响应 集 ” 对 话 框 
人 GE5362 从 “集合 定义 ”列表 框 中 选中 所 有 变量 ， 单 击 国 按 钮 使 之 选 入 “集合 中 的 变量 ” 列 
表 框 中 。 选 中 “二 分 法 ” 单 选 按钮 ， 并 在 “计数 值 ”文本 框 中 输入 1， 然 后 在 “名 称 ” 
和 “标签 ”文本 框 中 分 别 输入 “brand” 和 “品牌 ”。 
(GE363 单 击 “添加 ”按钮 ， 将 已 定义 好 的 多 重 响应 变量 集 选 入 “多 重 响应 集 ” 列 表 框 中 ， 
最 终 设 置 结果 如 图 10-5 所 示 。 


多 重 响应 集 (S) 
集合 中 的 安 量 (0): Sobrang 


注 : 北 处 定义 的 集合 仅 在 -多重 响应 频 硅 "和光 重 响应 交叉 到 ”过程 中 本 用。 对 于 委 在 其 他 位 辕 使 用 
请 使 用 部 据 荣 单 中 的 定义 条 重 哆 应 集 


EOE 
图 10-5 设置 一 个 多 重 响 应 集 “$brand” 


3. 实验 结果 及 分 析 


多 重 响 应 集 定义 完毕 后 ， 菜 单 栏 中 “分 析 ”|“ 多 重 响 应 ”命令 的 子 菜单 即 处 于 激活 状态 ， 
表示 可 以 通过 SPSS 相关 操作 获得 多 重 响应 集 的 频率 和 交叉 表 分 析 结 果 。 
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10.3 ”多重 响 应 变量 集 的 频率 分 析 


多 重 响应 变量 集 的 频率 分 析 , 是 在 多 重 响应 集 变量 定义 好 的 基础 上 进行 数据 分 析 , 相当 于 
普通 变量 的 频率 分 析 ， 不 同 的 是 把 普通 变量 换 成 多 重 响 应 变量 集 。 


10.3.1 ”多重 响应 变量 频率 分 析 简 介 


多 重 响应 变量 集 的 频数 分 析 , 即 对 已 经 定义 好 的 多 重 响 应 变量 集 输出 其 频数 及 其 总 频数 中 
的 百分比 等 基本 统计 量 。 它 与 一 般 的 频数 分 析 基 本 相同 , 区 别 为 一 般 频 数 分 析 输 出 的 是 单个 变 
量 的 频数 分 析 结 果 ， 多 重 响应 变量 集 的 频数 分 析 的 对 象 是 定义 好 的 多 重 响 应 变量 集 。 


10.3.2 ”多 重 响 应 变量 频率 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， [Bzgamas 
就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 进行 多 重 


响应 变量 集 的 频率 分 析 。 
1) 在 菜单 栏 中 选择 “分 析 ”|“ 多 重 响应 ”|“ 频 

率 ” 命 令 ， 打 开 如 图 10-6 所 示 的 “多 重 响应 频率 ”对 

话 框 。 


2) 进行 相关 的 设置 。 ET 
四 在 二 分 业内 成 列 持 院 个 过 [D) 


@ “多 重 响应 集 ” 列 表 框 。 该 列表 框 中 显示 的 是 | 日 大 WIRE 来 G) 


当前 已 经 定义 好 的 多 重 响应 变量 集 。 [于] we 医 加 区 癌 攻 0 
加 “ 表 "” 列 表 框 。 该 列表 框 中 为 从 “多 重 响应 集 ” 
列表 框 中 选 入 的 要 进行 频率 分 布 的 多 重 响应 变量 集 。 图 10-6 “多 重 响应 频率 ”对 话 框 


“缺失 值 ” 选 项 组 。 该 选项 组 用 于 选择 处 理 缺 失 值 的 方法 ， 包 括 以 下 两 个 复 选 框 : 


。 在 二 分 集 内 成 列 排除 个 案 : 选中 该 此 复 选 框 ， 则 表示 从 多 二 分 集 的 制 表 中 排除 任何 具有 变 
量 的 缺失 值 的 个 案 , 该 项 仅 应 用 于 定义 为 二 分 变量 的 多 重 响应 集 。 默认 情况 下 ， 如 果 多 二 
分 集中 的 某 个 个 案 的 成 分 变量 没有 一 个 包含 计数 的 值 ， 就 认为 该 个 案 缺 失 。 只 要 至 少 一 个 
变量 包含 计数 值 ， 那 么 即使 个 案 中 有 一 些 变量 的 值 缺 失 ， 这 些 个 案 也 包括 在 组 的 制 表 中 。 

。 在 类 别 内 成 列 排除 个 案 : 选中 该 复 选 框 ， 则 表示 从 多 类 别 集 的 制 表 中 排除 具有 任何 变量 的 
缺失 值 的 个 案 ， 该 仅 应 用 于 定义 为 类 别 集 的 多 重 响应 集 。 默 认 情况 下 ， 对 于 多 类 别 集 ， 仅 
当 某 个 个 案 的 成 分 没有 一 个 包含 定义 范围 内 的 有 效 值 时 ， 才 认为 该 个 案 缺 失 。 

3) 输出 结果 。 

设置 完毕 后 ， 单 击 “确定 ”按钮 ， 即 可 输出 多 重 响应 变量 集 频率 分 析 的 结果 。 


10.3.3 ”实验 操作 
对 多 重 响 应 变量 集 进 行 频 率 分 析 , 前 提 是 已 经 定义 了 一 个 或 多 个 多 重 响应 变量 集 。 因此 本 
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节 接 着 10.2 节 中 的 例子 进行 分 析 ，10.2 节 已 经 定义 了 
多 重 响应 变量 集 brand, 本 节 将 对 brand 进行 频率 分 析 。 
1. 实验 的 具体 操作 步骤 
人 ES6) 在 菜单 栏 中 选择 “分 析 ”|“ 多 重 响应 ”|* 频 
率 ” 命 令 ， 打 开 “ 多 重 响应 频率 ”对 话 框 。 
GC 本 ”从 “多 重 响 应 集 ”列表 框 中 选中 “ 品 
[$brand]”， 然 后 单 击 箭头 按钮 加 | 使 之 选 入 
“ 表 ” 列 表 框 中 ,其 他 采用 默认 设置 ,设置 
结果 如 图 10-7 所 示 。 


2. 实验 结果 及 分 析 


第 10 章 多 重 响 应 分 析 


多 重 响 应 集 () 表 OD: 


四 在 二 分 集 内 成 到 排除 个 案 (D) 
局 在 类 别 内 成 列 排队 个案 (G) 


ET 96 Li 
10-7 “多 重 响应 频率 ”对 话 框 


设置 完毕 后 ， 单 击 “ 确 定 ”按钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 10-8~ 图 10-9 


所 示 。 
图 10-8 所 示 的 个 案 摘要 给 出 了 多 重 响 应 变量 $brand 频率 
集 brand 中 有 效 数据 和 缺失 数据 的 基本 统计 信息 。 A | 
在 本 例 1000 个 案例 中 ， 有 111 个 数据 被 认为 是 缺 i = 元 ee 
4 区 本 油 
失 的 , 即 有 111 个 客户 没有 对 问卷 进行 回答 , 数据 许飞 区 pT a 
有 效率 为 88.9%。 页 士 带 261 70% 29.4% 
加 条 368 9.8% 41.4% 
请 扬 481 12.9% 54.1% 
个 案 摘要 舒 昔 485 13.0% 54.6% 
= 诱 镑 493 13.2% 55.5% 
效 了 gi 示 宜 502 13.4% 56.5% 
案 数 分 比 个 常数 百分比 个 案 数 春分 此 其 他 371 9.9% 41.7% 
brand” 889 88.9% 111 11.1% 1000 100.0% 总 计 3740 100.0% 420.7% 
a. 使 用 了 值 1 对 二 分 组 进行 制 表 。 a, 使 用 了 值 1 对 二 分 担 进 行 制 表 。 


图 10-8 多重 响应 变量 频数 分 析 个 案 摘 要 


10-9 多重 响应 变量 分 析 的 频率 


图 10-9 给 出 了 多 重 响应 分 析 的 频率 ， 其 中 N 表示 使 用 对 应 品牌 洗 发 水 的 客户 数目 ， 响 应 
百分比 表示 使 用 该 品牌 洗 发 水 的 消费 者 数目 占 使 用 总 频数 的 百分比 ,这 在 对 单个 变量 的 频数 分 
布 表 中 是 没有 的 ; 个 案 百分比 是 指使 用 该 品牌 洗 发 水 的 客户 数 占 总 客户 数 的 百分比 。 


10.4 多 重 响应 变量 集 的 交叉 表 分 析 


交叉 表 分 析 是 对 多 重 响应 变量 集 频 率 分 析 的 进一步 深入 ,前 提 同 样 是 已 经 定义 好 一 个 或 多 


个 多 重 响 应 变量 集 。 
10.4.1 多重 响 应 变量 交叉 表 分 析 简 介 


多 重 响应 变量 交叉 表 分 析 是 对 多 重 响应 变量 集 频率 分 析 的 深化 ,是 在 频率 分 析 的 基础 上 添 
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加 一 个 分 类 变量 , 交叉 表 分 析 根 据 分 类 变量 的 不 同 分 类 输出 多 重 响应 变量 集 包含 的 各 个 响应 的 
频率 及 百分比 。 


10.4.2 ”多 重 响应 变量 交叉 表 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 
后 ,就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 进 
行 多 重 响应 变量 交叉 表 分 析 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 多 重 响应 ”| 
“交叉 表 ” 命 令 ， 打 开 如 图 10-10 所 示 的 “多 重 响 
应 交叉 表 ” 对 话 框 。 

2) 设置 相应 的 选项 。 

中 “ 行 ”列表 框 。 用 于 从 源 变 量 列 表 框 中 或 一 
“多 重 响应 集 ” 列 表 框 中 选 入 的 输出 表 的 行 变量 。 ~ 

加 “ 列 ” 列 表 框 。 用 于 从 源 变量 列表 框 或 “多 生生 生生 于 
重 响应 集 ” 列 表 框 中 选 入 的 输出 表 的 列 变量 。 10-10 “多 重 响应 交叉 表 ” 对 话 框 

@ “ 层 ” 列 表 框 。 用 于 从 源 变量 列表 框 或 “多 重 响应 集 ” 列 表 框 中 选 入 输出 表 的 分 层 变 
量 。 对 分 层 变量 的 每 个 取 值 或 取 值 组 合 ， 将 输出 一 个 相应 行 变 量 的 二 维 交 叉 表 。 

@@ “定义 范围 ”按钮 。 选 入 行 、 列 或 层 变 量 后 ，“ 定 义 范围 ”按钮 将 自动 激活 ， 单 击 该 
按钮 ， 弹 出 如 图 10-11 所 示 的 “多 重 响应 交叉 表 : 定义 变量 范围 ”对 话 框 。 

在 该 对 话 框 中 可 以 为 相应 的 行 、 列 或 层 变量 设置 其 取 值 范围 ， 可 分 别 在 “最 小 值 ” “最 大 
值 ”文本 框 中 输入 变量 取 值 的 最 小 值 和 最 大 值 。 

设置 完毕 后 ， 单 击 “继续 ”按钮 ， 返 回 到 “多 重 响应 交叉 表 ” 对 话 框 进行 其 他 设置 。 

@ “多 重 响 应 集 ” 列 表 框 。 该 列表 框 中 显示 的 是 。 [起 二 重 和 上 六 X 表 :让 页 XX 
当前 已 经 定义 的 所 有 多 重 响 应 变量 集 。 


pe 


到 (N): 


ED: 


单元 格 百分比 
“选项 ”按钮 。 单 击 “ 选 项 ”按钮 ， 将 弹出 如 。 | | go) HD 
图 10-12 所 示 的 “多 重 响应 交叉 表 : 选项 ”对 话 框 。 a 


岗 多 重 响应 交 又 表 : 定义 .。 X 


最 小 值 ): | | 


百分比 基于 
图 人 来 @) 〇 响应 ) 


缺失 值 
器 在 二 分 集 内 成 列 排除 个 案 (E) 
加 在 类 别 内 成 列 排除 个 案 00 
[sj La La | 
图 10-11 “多 重 响应 交叉 表 : 定义 变量 范围 ”对 话 框 ” 图 10-12 “多 重 响 应 交叉 表 : 选项 ”对 话 框 
。 “单元 格 百分比 ”选项 组 : 该 选项 组 用 于 选择 在 单元 格 中 显示 哪些 类 型 的 百分比 ， 包 括 : 
> “ 行 ” 复 选 框 ， 若 选中 该 复 选 框 ， 则 表示 显示 行 百分比 ; 
> “ 列 ” 复 选 框 ， 若 选中 该 复 选 框 ， 则 表示 显示 列 百 分 比 ; 
> “总 计 ” 复 选 框 ， 若 选中 该 复 选 框 ， 则 表示 显示 总 百分比 。 另 外， 单元 格 总 会 显示 实 
测 的 统计 个 数 。 


最 大 值 00): [sl 
EE 
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。 “在 响应 集 之 问 匹 配 变量 ” 复 选 框 : 若 选 中 该 复 选 框 ， 则 表示 把 第 i 个 变量 集中 的 第 n 个 
变量 与 第 j 个 变量 集中 的 第 n 个 变量 配对 ， 且 单元 格 中 的 百分比 将 以 答案 总 数 为 基数 而 不 
是 以 回答 者 总 数 为 基数 。 

。 “百分比 基于 ”选项 组 : 用 于 设置 计算 百分比 的 基数 ， 包 括 两 个 单 选 按钮 : 
> “个 案 ” 单 选 按钮 ， 选 择 中 该 单 选 按钮 ， 表 示 以 回答 人 数 为 计算 百分比 的 基数 ; 
> “响应 ” 单 选 按钮 ， 选 择 中 该 单 选 按 钮 ， 表 示 以 总 的 答案 数 为 计算 百分比 的 基数 ， 当 

选中 “在 响应 集 之 间 匹 配 变 量 ” 复 选 框 后 ， 只 能 是 基于 响应 。 
。 “缺失 值 ”选项 组 : 用 于 选择 处 理 缺 失 值 的 方法 ， 包 括 两 个 复 选 框 。 
> 在 二 分 集 内 成 列 排除 个 案 : 若 选中 该 复 选 框 ， 则 表示 从 多 二 分 集 的 制 表 中 排除 任何 具 
有 变量 的 缺失 值 的 个 案 。 该 项 仅 应 用 于 定义 为 二 分 变量 的 多 重 响应 集 。 默 认 情况 下 ， 
如 果 多 二 分 集中 的 某 个 个 案 的 成 分 变量 没有 一 个 包含 计数 的 值 ， 就 认为 该 个 案 缺 失 。 
只 要 至 少 一 个 变量 包含 计数 值 ， 那 么 即使 个 案 中 有 一 些 的 值 缺失 ， 这 些 个 案 也 包括 在 
组 的 制 表 中 。 

> 在 类 别 内 成 列 排除 个 案 : 若 选中 该 复 选 框 ， 则 表示 从 多 类 别 集 的 制 表 中 排除 具有 任何 变 
量 的 缺失 值 的 个 案 ， 这 仅 应 用 于 定义 为 类 别 集 的 多 重 响应 集 。 默 认 情 况 下 ， 对 于 多 类 别 
集 ， 仅 当 某 个 个 案 的 成 分 没有 一 个 包含 定义 范围 内 的 有 效 值 时 ， 才 认为 该 个 案 缺 失 。 


3) 输出 分 析 结 果 。 
设置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 多 重 响应 变量 交 
又 表 分 析 的 结果 。 


10.4.3 ”实验 操作 
对 多 重 响应 变量 集 进行 交叉 表 分 析 , 前 提 是 已 经 定义 了 一 个 或 多 个 多 重 响 应 变量 集 。 因此 
本 节 接着 10.2 节 中 的 例子 对 brand 进行 交叉 表 分 析 ， 数 据 文件 为 “10-2”。 
1. 实验 数据 描述 


“10-2” 数 据 文件 在 “10-1” 数 
据 文件 的 基础 上 增加 了 “教育 水 平 ” 
变量 的 相关 数据 ， 用 以 反映 不 同 受 教 


-TE BE ED) Le sl EST | 

育 水 平 的 用 户 对 不 同 品牌 洗 发 水 的 Pe 
选择 ，“ 教 育 水 平 ”共有 5 种 分 类 ， 和 
es 吾 吾 至 三 三 王 至 : 
“大 学 本 科 ” 和 “硕士 及 以 上 ”， 下 es 
面 将 使 用 该 数据 文件 ， 利 用 交叉 表 分 和 
析 过 程 ， 得 到 按 “ 教 育 水 平 ”分 类 的 es 
多 重 响 应 变量 交叉 表 分 析 结 果 。 
|e 数据 文件 的 原始 Excel 数据 3 否 否 否 否 否 否 否 
如 图 10-13 所 示 。 图 10-13 “10-2” 数 据 文件 原始 数据 
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在 “10-1” 数 据 文件 的 变量 视图 中 添加 变量 “教育 水 平 ”， 用 数字 1~5 分 别 表示 “小 学 及 
以 下 ”“ 初 中 ”“ 高 中 ”“ 大 学 本 科 ” 和 “硕士 及 以 上 ”5 种 不 同 的 受 教 育 水 平 ，“10-2” 数 
据 文件 的 变量 视图 如 图 10-14 所 示 。 


对 右 锦 名 义 \ 久 入 
一 右 高 名义 \ 多 入 
台 右 起 吉 义 多 入 
杜 右 向 名 X 入 多 入 
泪 右 总 名 义 维和 
潭 证 轴 名 X 输入 
天 右 砚 名 X 纳入 
要 右 我 名 义 SN 策 入 
虱 右 秽 名 X 入 铂 入 
王 右 高 名义 上策 入 


无 
无 
无 
无 
无 
无 
无 
无 
无 
3 


BM SPSS Stabstcs 处 埋 程 序 镶 络 Unicode-ON 
图 10-14 “10-2” 数 据 文件 的 变量 视图 
在 SPSS 数据 视图 中 ,将 “教育 水 平 ” 变 量 的 值 加 入 到 “10-1” 数 据 文件 中 ， 构 建 “10-2” 
数据 文件 ， 输 入 完毕 后 的 部 分 数据 如 图 10-15 所 示 。 


遇 ' 玫 硬 虽 而 安 县 和 的 交 双 家 分 析 sav 革 拓 1] -IBM SPSS Statistics 归隐 本 可 笑 A 
文件 5 坊间 人 E) 站 看) 孝 括 人 D) 靳 搞 (中 分 析 反 ) 下 滑 MM) 四 RYG) 实用 程序 (J) 扩 解 09 窗口 8) 帮 助 t) 


TB SPSS Stabstcs 处 香 程 诛 络 | |Unicode ON 


图 10-15 “10-2” 数 据 文件 的 数据 视图 


2. 实验 操作 步骤 
有 具体 操作 步骤 如 下 : 
人 GE36) 在 菜单 栏 中 选择 “分 析 ”|“ 多 重 响应 ”|“ 交 叉 表 ”命令 ， 打 开 “ 多 重 响应 交叉 表 ” 


GE50? 将 $brand 变量 集 从 “多 重 响 应 集 ” 列 表 框 中 选 入 “ 行 ” 列 表 框 中 。 
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人 GES63 从 源 变量 列表 框 中 把 变量 “教育 水 平 ” 选 入 “ 列 ” 列 表 框 中 。 单 击 “ 定 义 范围 ” 按 
钮 , 打开 “多 重 响 应 交叉 表 : 定义 变量 范围 ” 对 话 框 ， 在 “最 小 值 ” 文本 框 中 输入 1， 
“最 大 值 ” 文 本 框 中 输入 5。 设置 完毕 后 , 单 击 “ 继 [ES 
竺 ” 扩 志 . 单元 格 百分比 
(GE3363 在 “多 重 响应 交叉 表 ” 对 话 框 中 单 击 “ 选 项 ”按钮 ， 区 本 
打开 “多 重 响应 交叉 表 : 选项 ”对 话 框 。 选 中 “ 单 i 
元 格 百分比 ”选项 组 中 的 “ 列 ” 复 选 框 ， 其 他 采用 ee 
默认 设置 ， 如 图 10-16 所 示 。 @ 人 案 (8) 回响 应 BR) 
设置 完毕 后 ， 单 击 “ 继 续 ” 按 钮 ， 返 回 到 “多 重 响应 交叉 i 
表 ” 对 话 框 。 已 在 类 别 内 成 列 排除 个 案 OO) 
3. 实验 结果 及 分 析 


设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ，SPSS Statistics 查看 器 窗 图 10-16 “多 重 响应 交叉 表 : 
口 的 输出 结果 如 图 10-17 和 图 10-18 所 示 。 选项 ”设置 结果 


总 计 


省 比 个 案 数 省 比 


S$brand* 教 育 水 笠 889 111 11.1% 1000 100.0% 


10-17 多 重 响 应 变量 交叉 表 分 析 个 案 摘要 


brand 教育 


计数 
占 教育 水 平 的 可 分 比 
计 散 
点 教育 水 平 的 百分比 
计数 
占 教 育 水 平 的 百分比 
计数 
占 教育 水 平 的 百分比 
计数 
点 教育 水 平 的 百分比 
计数 
占 教育 水 平 的 百分比 
计数 
古 教 育 水 平 的 百分比 
计 菇 
二 教育 水 下 的 百分比 
计数 
点 教育 水 平 的 百分比 

总 计 计数 

百分比 和 总 计 基于 响应 者 。 

3a. 使 用 了 值 1 对 二 分 组 进行 制 表 。 


10-18 ”多重 响应 变量 分 析 交 叉 制 表 
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图 10-17 所 示 的 个 案 摘 要 中 给 出 了 多 重 响应 变量 集 brand 中 有 效 数 据 和 缺失 数据 的 基本 统 
计 信 息 。 在 本 例 1000 个 案例 中 ， 有 111 个 数据 被 认为 是 缺失 的 ， 即 有 111 个 消费 者 没有 回答 
问题 。 

图 10-18 给 出 了 多 重 响 应 变量 交叉 表 , 其 中 每 个 单元 格 显示 了 使 用 各 种 品牌 洗 发 水 的 不 同 
受 教育 水 平 的 人 数 以 及 在 以 客户 数 为 基数 的 列 百 分 比 。 以 夏 士 莲 和 “初中 ” (2) 的 交叉 单元 
格 为 例 ， 表 示 有 初中 学 历 的 使 用 夏 士 莲 的 消费 者 有 61 人 ， 在 有 初中 学 历 客户 总 数 261 人 中 的 
比例 为 24.3%。 其 他 单元 格 的 解读 方法 与 此 类 似 。 


10.5 使 用 表 过 程 研究 多 重 响应 变量 集 


SPSS 的 表 分 析 过 程 也 提供 了 对 多 重 响应 变量 集 进行 定义 和 分 析 的 功能 。 使 用 前 也 需要 先 
建立 一 个 多 重 响应 变量 集 ， 然 后 使 用 表 过 程 进 行 分 析 , 所 起 的 作用 和 效果 与 多 重 效应 变量 集 的 
交叉 表 分 析 相 似 。 

本 节 将 使 用 “10-2” 数 据 文件 介 绍 表 过 程 在 多 重 响应 变量 集 定义 和 分 析 中 的 功能 。 


10.5.1 定义 多 重 响 应 变量 集 
表 过 程 中 的 多 重 响应 变量 集 定义 的 具体 操作 过 程 如 下 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 表 ”|“ 多 重 响应 集 ”命令 ， 打 开 如 图 10-19 所 示 的 “定义 
多 重 响应 集 ” 对 话 框 。 该 对 话 框 与 图 10-4 所 示 的 “定义 多 重 响应 集 ”对 话 框 相似 ， 只 多 了 一 
个 “类 别 标签 来 源 ” 选 项 组 。 该 选项 组 用 于 设置 多 重 响应 二 分 类 变量 集 输出 表格 的 标签 格式 ， 
包括 两 个 单 选 按钮 : 

人 @ 变量 标签 。 若 选中 该 单 选 按钮 ， 则 表示 使 用 已 定义 的 变量 标签 或 不 带 已 定义 变量 标签 
的 变量 的 变量 名 作为 集 类 别 标签 。 例如 , 如 果 集 中 的 所 有 变量 对 于 已 计算 的 值 具有 相同 的 值 标 
签 ， 则 应 使 用 变量 标签 作为 集 类 别 标签 。 

@ 计数 值 的 标签 。 若 选中 该 单 选 按钮 ， 则 表示 用 已 计算 的 值 的 已 定义 值 标签 作为 集 类 别 
标签 。 只 有 在 所 有 变量 对 于 已 计算 的 值 都 定义 了 值 标签 , 且 已 计算 的 值 的 值 标签 对 于 每 个 变量 
都 不 相同 时 选择 此 选项 。 此 时 ,将 激活 “将 变量 标签 用 作 集合 标签 ” 复 选 框 。 若 选中 该 复 选 框 ， 
则 表示 也 可 以 使 用 集中 具有 已 定义 变量 标签 的 第 一 个 变量 的 变量 标签 作为 集 标签 ;如 果 集 中 的 
变量 都 未 定义 变量 标签 ， 则 将 集中 第 一 个 变量 的 名 称 作为 集 标签 。 


2) 从 “集合 定义 ”列表 框 中 选中 所 有 变量 并 将 其 选 入 “集合 中 的 变量 ”列表 框 中 。 选 中 
“二 分 法 ” 单 选 按钮 ， 并 在 “计数 值 ”文本 框 中 输入 1， 然 后 在 “集合 名 称 ” 和 “集合 标签 ” 
文本 框 中 输入 “brand” 和 “品牌 ”“ 类 别 标签 来 源 ” 选 择 为 “变量 标签 ”。 

3) 单 击 “ 添 加 ”按钮 ， 将 已 定义 好 的 多 重 响应 变量 集 先入 “多 重 响应 集合 ”列表 框 中 ， 
如 图 10-20 所 示 。 

4) 单 击 “确定 ”按钮 ， 完 成 多 重 响应 变量 集 的 定义 ， 得 到 如 图 10-21 所 示 的 “多 重 响应 
集 ” 结 果 。 该 图 给 出 了 多 重 响应 变量 集 的 名 称 、 标 签 、 数 据 类 型 等 信息 。 
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x 
此 处 定义 的 集合 在 容重 响应 频率 "和 穷 重 
集合 中 8 时 0): 响应 交叉 来 -过程 中 不 可 
多 重 员 应 集合 (S): 
Sbrand 
计数 十 山 : re 
| ney 
| ee 
A 
国 上 六 重 村 兰 朋 作 舌 证 村 兰 
入 SN): 
类 合 标签 人) 
LE je ae an Hu | 


10-19 表 分 析 过 程 的 “定义 多 重 响应 集 ” 对 话 杠 


多 称 标签 编码 为 


10-20 设置 多 重 响应 集合 “S$brand” 


计数 值 数据 类 型 


Sbrand 曲牌 -分 法 


数字 


10-21 多 重 响应 集 输出 结果 
10.5.2 ”用 表 过 程 建立 包含 多 重 响应 变量 集 的 表格 


本 节 将 在 10.5.1 节 的 基础 上 利用 表 过 
程 对 已 定义 的 Sbrand 多 重 效应 变量 集 制 表 
以 实现 输出 与 如 图 10-18 所 示 相 同 信息 的 
图 形 。 

用 表 过 程 建立 包含 多 重 响应 变量 集 表 
格 的 具体 操作 过 程 如 下 : 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 表 ”| 
“定制 表 ” 命 令 ， 打 开 如 图 10-22 所 示 的 
“定制 表 ” 对 话 框 。 

2) 从 “变量 ”列表 框 中 选中 $brand 多 
重 效应 变量 集 ， 将 其 拖 到 “常规 ”文本 框 中 
的 “ 列 ” 栏 ， 然 后 从 “变量 ”列表 框 中 选中 
分 类 变量 “教育 水 平 ”， 将 其 拖 到 “常规 ” 
文本 框 中 的 “ 行 ” 栏 。 


图 10-22 “定制 表 ” 对 话 框 
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3) 选中 “ 列 ” 栏 中 的 Sbrand 变量 ， 单 击 “ 摘 要 统计 ”按钮 ， 打 开 “ 摘 要 统计 ”对 话 框 ， 
从 “统计 ”列表 框 中 选中 “ 行 N%”， 单 击 右 侧 的 第 头 按钮 国 ， 使 之 选 入 “显示 ”列表 框 中 。 
最 后 单 击 “ 应 用 于 所 选项 ”按钮 ， 返 回 “ 定 制 表 ”对 话 框 。 

4) 单 击 对 话 框 中 的 “确定 ”按钮 ， 则 可 输出 如 图 10-23 所 示 的 结果 。 该 图 所 反映 信息 与 
图 10-18 反映 信息 一 致 。 


NN% Ms 六 NS sg 8 N% NY NS 让 N% i N% 


WeT 1 EEC EEC 1 ow 1 CE PE EECT EEC ow 
日 1 3 20% 3% EE ET M335% 
1 107 。 57% CE 0% 嫩 3% 10 535% 101 526% 105 552% 106 552% 9 45% 
4 139 G2% 104 458% 101 445% 145 639% 12 S5133% 115 S11% 119 S524% 120 529% 141 621% 
5 51 Mo% EE 1 0% 5 5% EW 7% EN Ee 9% 


图 10-23 表 过 程 关 于 多 重 响 应 变量 集 的 表格 输出 


10.6 上 机 题 


三 视频 文件 : \sample\ 上 机 题 \chap10\... 

10.1 下 表 给 出 了 某 城市 居民 上 下 班 常 用 交通 工具 调查 的 部 分 数据 , 被 调查 对 象 按 年 龄 被 
分 为 三 类 ， 分 别 用 1、2、3 表示 ， 交 通 工具 变量 中 0、1 分 别 代 表 “ 否 ”和 “是 ”。 试 用 多 重 
响应 分 析 程 序 定义 多 重 响应 变量 集 “$traf”， 并 对 “S$traf ”进行 频率 分 析 和 交叉 表 分 析 。 ( 数 
据 路 径 : 视频 文件 \sample\ 上 机 题 \chap10\ 习 题 \ 第 10 章 第 一 题 .sav) 


编号 自行 车 其 他 
1 1 Y 
2 0 0 
a 0 Y 
4 1 ¥ 
5 1 | 
6 1 
所 1 1 
8 1 
9 1 1 
10 0 0 
地 0 0 
12 1 0 
13 0 0 
14 0 0 
LE 入 1 
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10.2 有 调查 者 对 某 中 学 三 个 年 级 学 生 的 最 喜欢 科目 进行 了 调查 ， 下 表 给 出 了 部 分 数据 ， 
其 中 “年 级 ”变量 用 1-3 分 别 代表 初中 一 到 三 年 级 , 各 科 变 量 中 的 0 和 1 分 别 代 表 “ 否 ”和 “是 ”。 
试用 表 过 程 定义 多 重 响应 变量 集 “$sub”， 并 对 “$sub” 进 行 交叉 表 分 析 。 (数据 路 径 ， 视频 
文件 \sample\ 上 机 题 \chap10\ 习 题 \ 第 10 章 第 二 题 .sav) 


英语 物理 化 学 


并 
[3 


-|o|l-lololo|l-|-|i-|I-|-|iol-lo|l- 
olo|l-|-|i-|-|-|lol-locloc|-|lolo|l- 
oloc|-|locl-|loc|-|-|I-|loclcilcloclo|l- 


w|i 全- ||=|S| 人 Se 
|-lelelels|-|l-lr-lrlelesel-lrle 
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聚 类 分 析 是 根据 研究 对 象 的 特征 , 按照 一 定 标准 对 研究 对 象 进行 分 类 的 一 种 分 析 方 法 。 它 
使 组 内 的 数据 对 象 具有 最 高 的 相似 度 ,而 组 间 具 有 较 大 的 差异 性 。 聚 类 分 析 可 以 在 没有 先 验 分 
类 的 情况 下 通过 观察 对 数据 进行 分 类 ， 在 科学 研究 和 实际 的 生产 实践 中 都 具有 广泛 的 应 用 ， 
SPSS 的 分 类 过 程 可 以 使 用 户 方便 地 实现 聚 类 分 析 ， 本 章 将 对 聚 类 分 析 的 SPSS 实现 过 程 进 行 
介绍 。 


11.1 聚 类 分 析 的 基本 原理 


聚 类 分 析 是 根据 对 象 的 特征 ， 按 照 一 定 的 标准 对 研究 对 象 进行 分 类 ， 由 于 研究 对 象 和 分 
析 方 法 的 不 同 ， 聚 类 分 析 也 分 为 不 同 的 种 类 。 
按照 研究 对 象 的 不 同 ， 聚 类 分 析 一 般 分 为 样本 聚 类 和 变量 聚 类 。 


。 样本 聚 类 又 称 Q 型 聚 类 ， 它 针对 实测 量 进行 分 类 ， 将 特征 相近 的 实测 量 分 为 一 类 ， 特 征 差 
异 较 大 的 实 察 量 分 在 不 同 的 类 。 

。 变量 聚 类 又 称 R 型 聚 类 ， 它 针 对 变量 分 类 ， 将 性 质 相近 的 变量 分 为 一 类 ,将 性 质 差异 较 大 
的 变量 分 在 不 同 的 类 . 

按照 分 析 方法 的 不 同 ， 聚 类 分 析 一 般 分 为 快速 聚 类 、 分 层 聚 类 和 两 阶段 聚 类 。 


。 快速 聚 类 又 称 K- 平 均值 聚 类 ， 它 将 数据 看 作 K 维 空间 上 的 点 ， 以 距离 为 标准 进行 聚 类 分 
析 ， 将 样本 分 为 指定 的 KK 类 。 

。 分 层 聚 类 也 称 系统 聚 类 ， 其 对 相近 程度 最 高 的 两 类 进行 合并 ， 组 成 一 个 新 类 并 不 断 重复 此 
过 程 ， 直 到 所 有 的 个 体 都 归 为 一 类 。 

。 两 阶段 聚 类 分 析 首先 以 距离 为 依据 形成 相应 的 聚 类 特征 树 结 点 构造 聚 类 特征 树 ， 然 后 通过 
信息 准则 确定 最 优 分 组 个 数 对 各 个 结 点 进行 分 组 。 

聚 类 分 析 要 求 不 同 组 间 具 有 较 大 的 差异 , 分析 中 个 体 的 差异 程度 通常 用 距离 来 表示 ,下 面 

介绍 聚 类 分 析 中 一 些 常用 的 距离 及 其 定义 方式 。 


1. 定 距 变量 的 常用 距离 


(1) 欧式 距离 
欧式 距离 指 两 个 体 之 间 变 量 差 值 平方 和 的 平方 根 ， 欧 式 距离 的 数学 定义 如 公式 (11-1) 所 示 。 


d= QD 
i=1 
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(2) 欧式 距离 平方 和 
欧式 距离 平方 和 指 两 个 体 之 间 变 量 差 值 的 平方 和 ， 欧 式 距离 平方 和 的 数学 定义 如 公式 
(11-2) 所 示 。 


ds = ) (11-2) 
(3 ) 切 贝 谢 夫 距 离 


切 贝 谢 夫 距离 指 两 个 体 之 间 的 变量 差 值 绝 对 值 的 最 大 值 ， 切 贝 谢 夫 距离 的 数学 定义 如 公 
式 (11-3) 所 示 。 


ds —maxlx, —» (11-3) 


(4) 布 洛克 距离 
布 洛克 距离 指 两 个 体 之 间 的 变量 差 值 绝对 值 之 和 ， 布 洛克 距离 的 数学 定义 如 公式 (11-4) 
所 示 。 


do=y>e-y (11-4) 
和 1 


(5) 明 考 斯 基 距离 
明 考 斯 基 距离 指 两 个 体 之 间 的 变量 差 值 的 k 次 方 之 和 的 k 次 方 根 ， 明 考 斯 基 距离 的 数学 


定义 如 公式 〈11-5) 所 示 。 
二 = —y)" (11-5) 
i=] 
(6) 夹 角 余弦 距离 


夹 角 余弦 距离 的 数学 定义 如 公式 〈11-6) 所 示 。 


~ 2 
i (11-6) 


如 天 下 
| |207 
i=l i=l 
(7) 自 定义 距离 


自 定义 距离 指 两 个 体 之 间 的 变量 差 值 的 p 次 方 之 和 的 q 次 方 根 (p、q 由 用 户 自行 定义 )， 
自 定义 距离 的 数学 定义 如 公式 〈11-7) 所 示 。 


ds -Ee -yy (11-7) 


2. 定 序 变量 的 常用 距离 


(1) 卡 方 距离 
卡 方 距 离 的 数学 定义 如 公式 〈11-8) 所 示 。 
下 lx EG Sy — EG (11-8) 
上 Et) SE EG) 
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(2 ) Phi 方 距离 
Phi 方 距 离 的 数学 定义 如 公式 〈11-9) 所 示 。 


EEC , Kb EO, 
和 昌 ED) 六 


所 Ey) (11-9) 


3. 二 值 变量 的 常用 距离 
(1) 简单 相关 系数 
简单 相关 系数 的 定义 如 公式 〈11-10) 所 示 。 


b+ec 
二 = (11-10) 
PCy) a+D+c+d 
其 中 ， 两 个 体 同时 为 0 时 的 频率 记 作 4 ; 两 个 体 同时 为 1 的 频率 记 为 a ; 个 体 x 为 0、 个 
体 y 为 1 的 频率 记 为 c; 个 体 y 为 0、 个 体 x 为 1 的 频率 记 为 b。 
(2) 雅克 比 相关 系数 
雅克 比 相关 系数 的 定义 如 公式 〈11-11) 所 示 。 


b+ec 
EP (11-11) 
PD) a+D+c+d 


其 中 ， 两 个 体 同 时 为 0 时 的 频率 记 作 dg ， 两 个 体 同时 为 1 的 频率 记 为 a; 个 体 x 为 0、 个 
体 ? 为 1 的 频率 记 为 ， 个体 ?为 0、 个体 x 为 1 的 频率 计 为 b。 


11.2 快速 聚 类 


快速 聚 类 是 在 聚 类 个 数 已 知 的 情况 下 ， 快 速 将 个 体 分 配 到 各 类 的 一 种 聚 类 方法 。 
11.2.1 快速 聚 类 的 基本 原理 

快速 聚 类 又 称 区 -均值 聚 类 , 它 将 数据 看 作 K 维 空间 上 的 点 , 以 距离 为 标准 进行 聚 类 分 析 。 
快速 聚 类 只 能 产生 指定 个 数 的 分 类 ， 它 以 牺牲 多 个 解 为 代价 以 获得 较 高 的 执行 效率 。SPSS 的 
快速 聚 类 过 程 适用 于 对 大 样本 进行 快速 聚 类 ,尤其 是 对 形成 的 类 的 特征 (各 变量 值 范围 ) 有 了 
一 定 认识 时 ， 快 速 聚 类 不 失 为 一 种 优良 的 方法 。 

快速 聚 类 的 思想 是 ， 首 先 选择 k 个 观测 量 作为 初始 的 聚 类 中 心 点 ， 根 据 距离 最 小 的 原则 
将 各 个 实测 量 分 配 到 这 k 个 类 中 ; 然后 将 每 一 个 类 中 的 实测 量 计算 变量 均值 , 这 个 均值 又 形 
成 新 的 k 个 聚 类 中 心 点 。 依 次 类 推 ， 不 断 进行 迭代 ， 直 到 收敛 或 达到 分 析 者 的 要 求 为 止 。 
11.2.2 ”快速 聚 类 的 SPSS 操作 

建立 或 打开 相应 数据 文件 后 ,就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 进行 快速 聚 类 分 析 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 分 类 ”|“K- 均 值 聚 类 ”命令 ， 打 开 如 图 11-1 所 示 的 “K 
均值 聚 类 分 析 ” 对 话 框 。 
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2) 选择 变量 。 从 源 变量 列表 框 中 选择 参与 聚 类 分 析 的 目标 变量 ， 将 其 选 入 “变量 ”列表 框 
中 ; 从 源 变量 列表 框 中 选择 属 类 变量 ， 将 其 选 入 “个 案 标注 依据 ”列表 框 中 ， 如 图 11-2 所 示 。 


四 K 艾 BR 分析 


x | | 全 Ki 


和 Etoa 
党 
国 Eee RE 
他 
到 类 坝 (U): E 方 和 MW: I 
图 半 代 与 分 类 四 口 仅 分 类 0 | 图 选 代 与 分 类 [D 日 保 分 类 0 
村 类 中心 [Re 
站 读 取 初 的 累 类 中 心 {E): 四 旋 W 科 站 尼 闪 中 心 (E): 
和 条 开 娄 损 震 届 [BEL 
本 外 仓 直 吉文 件 四 本 关 计 手 更 文件 四 
四 写 入 最 疼 加 内 中 心 N): 日 写 入 最 关 于 入 中 心 人 
DEL 请 攻 所 必 
[CE = 加 EE ES 
图 11-1 “KK 均 值 聚 类 分 析 ” 对 话 杠 图 11-2 ”快速 聚 类 的 变量 选择 


3) 设置 相应 的 选项 。 

@ “ 聚 类 数 ”文本 框 。 该 文本 框 用 于 设置 聚 类 的 数目 ， 系 统 默认 分 为 两 类 ， 用 户 可 以 在 
文本 框 中 输入 自 定义 的 聚 类 数目 。 

@ “方法 ”选项 组 。 该 选项 组 用 于 设置 聚 类 分 析 的 方法 ， 有 两 种 方法 可 供 选择 :“ 和 迭代 
与 分 类 ”， 该 方法 在 聚 类 过 程 中 不 断 改变 凝聚 点 ;“ 仅 分 类 ”， 该 方法 在 聚 类 过 程 中 始终 使 用 初 

@@ “ 聚 类 中 心 ”选项 组 。 该 选项 组 用 于 读 取 和 写 入 初始 聚 类 中 心 ， 用 户 可 以 从 数据 文件 
或 外 部 数据 集中 读 取 初始 聚 类 中 心 ， 也 可 以 将 聚 类 过 程 凝聚 点 的 最 终结 果 保 存 到 数据 文件 中 。 

图 “迭代 ”按钮 。 只 有 在 “方法 ”选项 组 中 选中 “迭代 与 分 类 ” 单 选 按钮 ， 该 按钮 才 会 
被 激活 。 单 击 “ 迭 代 ” 按 钮 ， 弹 出 如 图 11-3 所 示 的 “区 均值 聚 类 分 析 : 迭代 ”对 话 框 。 

该 对 话 框 用 于 设置 聚 类 分 析 中 迭代 的 终止 条 件 。 

。 “最 大 和 迭代 次 数 ”文本 框 中 的 数值 表示 迭代 达到 或 超过 该 数值 时 ， 停 止 迭 代 过 程 ; 

。 “收敛 条 件 ”文本 框 中 的 数值 表示 凝聚 点 改变 的 最 大 距离 小 于 初始 聚 心 距离 的 比例 ， 当 距 

离 小 于 该 数值 时 ， 停 止 迭 代 。 
。 如 选中 “使 用 运行 平均 值 ” 复 选 框 ， 则 表示 每 分 配 一 个 观测 后 ， 立 刻 计算 新 的 凝聚 点 。 


加 “保存 ” 按钮。 单 击 “ 保 存 ” 按 钮 ， 弹 出 如 图 11-4 所 示 的 “K- 均 值 聚 类 : 保存 新 变量 ” 


图 11-3 “区 均 值 取 类 分 析 : 迭代 ”对 话 框 图 11-4 “K- 均 值 聚 类 : 保存 新 变量 ”对 话 框 
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该 对 话 框 用 于 设置 保存 形式 。 如 选中 “ 聚 类 成 员 ” 复 选 框 ， a 
系统 将 保存 观测 的 分 类 结果 ; 如 选中 “与 聚 类 中 心 的 距离 ” 复 选 有 
框 ， 系 统 会 将 各 观测 与 所 属 类 的 聚 类 中 心 的 欧 氏 距离 作为 一 个 新 局 RE 


变量 进行 保存 。 ee 
@ “选项 ”按钮 。 单 击 “ 选 项 ”按钮 ， 弹 出 如 图 11-5 所 示 全 一 一 一 一 一 
人 1 » : © 

的 “K- 均 值 聚 类 分 析 : 选项 ”对 话 框 。 Fat ee 


e 统计 : 该 选项 组 用 于 设置 输出 的 统计 量 ， 其 包含 “初始 聚 类 
中 心 ” “ANOVA 表 ” 和 “每 个 个 案 的 聚 类 信息 ”3 个 复 选 
框 , 分别 用 于 输出 初始 聚 类 中 心 、 方差 分 析 表 和 各 观测 的 聚 ”图 1-5 “天 均值 聚 类 分 析 : 
类 信息 。 选项 ”对 话 框 

e ”缺失 值 : 该 选项 组 用 于 设置 缺失 值 的 处 理 方式 ，“ 成 列 排除 个 案 ” 表 示 从 所 有 分 析 中 排除 
任何 变量 具有 缺失 值 的 个 案 ; “成 对 排除 个 案 ” 表 示 从 分 析 中 排除 变量 对 中 有 一 个 或 两 个 
缺失 值 的 个 案 。 


4) 分 析 结 果 输 出 。 设 置 完 毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 结果 窗口 得 
到 快速 聚 类 分 析 的 结果 。 


11.2.3 ”实验 操作 
下 面 将 以 数据 文件 “11-1” 为 例 ， 讲 解 快速 聚 类 分 析 的 具体 操作 过 程 并 对 输出 结果 进行 说 明 。 
1. 实验 数据 描述 


数据 文件 “11-1” 的 内 容 为 我 国 31 省 市 各 类 农产品 种 植 面积 数据 ， 数 据 来 自 《 中 国 农村 
统计 年 鉴 》， 利 用 快速 聚 类 分 析 方 法 来 分 析 我 国 不 同 省 市 之 间 农 产品 种 植 结构 的 差异 与 共性 。 
数据 文件 的 原始 数据 如 图 11-6 所 示 。 


i 
00% 王 
具体 ea 
13 
A 8 Cc ] D E 工 加 H 
1 | 地 区 根 食 ( 万 公顷 ) 瓜 果 (万 公顷 ) 蔬 系 (万 公园 粮 花 (万 公顷 ) ,烟叶 (万 公顷 ) ,油料 (万 公顷 】 糖 料 (万 公顷 ) 
2 | 北京 55.5 26 24.7 0.6 0 FT 0 
3 | 天 津 657.5 1.9 23.4 15.3 0 0.9 0 
4 河北 0.6 二 12.8 这 6.1 0.2 
5| UU 西 B17 1 6 2.9 0.1 5.9 0.1 
6 | 内 蒙古 "0.9 0.8 a 0 0.1 10.5 0.8 
辽宁 83.8 0.9 9.5 0 0.3 4.2 0 
8 | 吉林 96.8 1 3 0 0.5 5.8 0.1 
9 | 时 龙 江 86.2 工 2 3.2 0 0.3 41 
10| 上 海 41.2 5.5 35.9 0.3 0 6 0.4 
11 | 江苏 65.6 17 15.3 和 .7 10.7 
新 江 59.5 4 23.6 D.6 .1 8.3 0.5 
安 激 a FI T.7 4.3 0.1 12.6 0.1 


图 11-6 ”数据 文件 “11-1” 原 始 数据 
在 SPSS 的 变量 视图 中 建立 “地 区 ”变量 ， 表 示 各 个 省 市 ; 建立 “粮食 ”“ 瓜 果 ”“ 蔬 菜 ” 
“棉花 ”“ 烟 草 ”“ 油 料 ” 和 “ 糖 料 ”变量 ， 分 别 表 示 各 种 农作物 的 种 植 面积 ， 如 图 11-7 所 示 。 
在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 
数据 如 图 11-8 所 示 。 
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起 "过 半分 本 sav [RB 和 1] -9M SPSS Statistics 政 晤 太 疾 Ei 


天 于 
下 | 元 
无 元 
本 区 
于 天 
于 网 
于 区 
严 网 


[eM SPSS Siatstcs 处 于 和 名 络 | TUnicode ON 


11-7 数据 文件 “11-1” 变 量 视图 


起 ,SSHWi sav 黄酮 宁 1] - 四 M SPSS Statistics 雪 碗 吕 项 - DO x 
文件 四 才 镜 但 醒 看 ( 吉 据 中 困 执 中 分析 办 下 清 GERG) 实用 程序) 扩 开 09 证 吕 ) 大 td) 


F750 
7060 
70 
7090 
5380 
5680 
8620 
4120 
3 
EE 
7100 
5730 
上 590 
ET 


eM SPSS Stabsics 外 到 避 才 |， UnicodeON| | 


图 11-8 数据 文件 “11-1” 数 据 视 图 


2. 实验 操作 步骤 
GE) 在 菜单 栏 中 选择 “分 析 ”|“ 分 类 ”|“K- 均 值 聚 类 ”命令 ， 打 开 “K 均值 聚 类 分 析 ” 


人 GE562 从 源 变量 列表 框 中 选择 “粮食 ”“ 瓜 果 ”“ 蔬 菜 ”“ 棉 花 ”“ 烟 草 ”“ 油 料 ” 和 “ 糖 料 ” 
变量 ， 单 击 国 | 按 钮 将 它们 选 入 “变量 ”列表 框 中 ; 从 源 变 量 列表 框 中 选择 “地 区 ” 
变量 ， 将 其 选 入 “个 案 标注 依据 ”列表 框 中 。 

GE363 在 “ 聚 类 数 ” 文 本 框 中 输入 聚 类 的 数目 ， 本 实验 将 变量 分 为 四 类 。 

GE365 单 击 “选项 ”按钮 ， 在 打开 的 “K- 均 值 聚 类 分 析 ” 对 话 框 中 选中 “每 个 个 案 的 聚 类 
信息 ” 复 选 框 ， 单 击 “ 继 续 ” 按 钮 。 

EET05 单 击 “确定 ”按钮 ， 输 出 快速 聚 类 分 析 的 结果 ， 如 图 11-9~ 图 11-12 所 示 。 
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图 11-9 给 出 了 每 一 次 迭代 的 聚 类 中 心 内 的 更 改 情况 。 我 们 可 以 看 出 ， 经 过 两 次 迭代 ， 聚 


类 中 心 达到 收敛 。 
图 11-10 和 图 11-11 给 出 了 最 终 聚 类 的 中 心 和 最 终 聚 类 中 心间 的 距离 。 
最 终 聚 类 中 心 
迁 代 历史 记录 采 类 
1 2 3 4 
聚 类 中 心中 的 变动 
ED 5488 3920 5798 7288 
还 代 1 2 3 4 -一 
到 村 2.58 190 85 1.33 
1 17174 000 15933 15.290 La 490 1068 917 
2 000 000 000 000 棉花 210 3320 190 216 
a. 由 于 聚 类 中 心中 不 存在 变动 或 者 仅 有 小 幅 变 动 ， 烟草 50 00 1.53 .71 
因此 实现 了 收效 。 任 何 中 心 的 最 大 绝对 坐标 变动 
为 .000。 当 前 迄 代 为 2。 初 怒 中 心 之 间 的 最 小 距 ME a a 1950 B04 
离 为 40.912。 | 200 1 1 4 
图 11-9 和 迭代 历史 记录 图 11-10 “最终 聚 类 中 心 
聚 类 成 员 
图 11-12 给 出 了 每 一 个 实测 所 属 的 类 和 和 | 


每 个 聚 类 中 的 案例 数 。 通 过 聚 类 分 析 我 们 可 
以 看 出 ， 所 有 的 实测 按照 与 聚 心 的 距离 被 分 
成 了 四 类 。 

通过 聚 类 分 析 的 结果 可 以 看 出 ， 所 有 的 
省 市 被 分 成 了 四 类 ， 第 一 类 省 市 以 蔬菜 种 植 
为 主要 特色 ， 第 二 类 省 市 以 棉花 种 植 为 主要 
特色 ， 第 三 类 省 市 以 油料 种 植 为 主要 特色 ， 


有 1 
2 1 
ye 4 
4 4 
5 4 
6 4 
元 4 
下 
9 1 
10 4 
1 1 
12 4 
1 1 
14 
11-12 给 出 了 各 个 省 市 所 处 的 分 组 ， 通 过 聚 类 。 站 一. 人 as 

16 4 
417 3 
18 3 
19 1 
20 1 
21 1 
2 4 
bz) 4 
34 3 

4 

4 

4 

4 

3 

4 


第 四 类 省 市 没有 明显 的 特色 种 植 。 同 时 ， 图 sa sm 
分 析 我 们 可 以 清楚 地 区 分 各 个 省 市 的 农业 种 证 2 
= 泗 南 7.659 
植 结构 差异 。 ““ 医 3879 
广西 12.748 
ss 5633 
= 重庆 3.997 
四 川 6.753 每 个 聚 类 中 的 个 案 数 
最 终 聚 类 中 心 之 间 的 距离 a 人 目 
mm ，  : | ， | ， 置 g » ee 
40.038 。 20.075 24.123 2 Am S109 i 
2 40.038 _ 39807 46.238 | 2 a i 
区 20.075 。 39.807 18.302 兰 一 a 有 站 31000 
4 24.123 46.238 18.302 i Li 2 .000 缺失 .000 
图 11-11 最终 聚 类 中 心 之 间 的 距离 图 11-12 聚 类 成 员 


11.3 ”分 层 聚 类 


分 层 聚 类 是 应 用 比较 广泛 的 一 种 聚 类 方式 ， 其 聚 类 过 程 是 按照 一 定 的 层次 进行 的 。 
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11.3.1 分 层 聚 类 的 基本 原理 


分 层 聚 类 也 称 系统 聚 类 。 其 主要 思想 是 ， 首 先 将 每 一 个 个 体 看 作 一 类 ， 然 后 将 相近 程度 
最 高 的 两 类 进行 合并 组 成 一 个 新 类 , 再 将 该 新 类 与 相似 度 最 高 的 类 进行 合并 ,不 断 重 复 此 过 程 ， 
直到 所 有 的 个 体 都 归 为 一 类 。 

正如 样品 之 间 的 距离 可 以 有 不 同 的 定义 方法 一 样 ， 类 与 类 之 间 的 距离 也 有 各 种 定义 。 类 
与 类 之 间 用 不 同 的 方法 定义 距离 , 就 产生 了 不 同 的 系统 聚 类 方法 。 本 节 介绍 常用 的 8 种 系统 聚 
类 方法 ， 即 最 短 距离 法 、 最 长 距离 法 、 中 间距 离 法 、 重 心 法 、 类 平均 法 、 可 变 类 平均 法 、 可 变 
法 、 离 差 平 方 和 法 。 


11.3.2 ”分 层 聚 类 的 SPSS 操作 


建立 或 打开 相应 的 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 进行 分 层 聚 类 
的 分 析 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 分 类 ”|“ 系 统 聚 类 ”命令 ， 打 开 如 图 11-13 所 示 的 “系统 

2) 选择 变量 。 从 源 变量 列表 框 中 选择 参与 分 层 聚 类 分 析 的 目标 变量 ， 将 选中 的 变量 选 入 
“变量 ”列表 框 中 ， 从 源 变 量 列表 框 中 选择 属 类 变量 ,将 选中 的 变量 选 入 “个 案 标注 依据 ” 列 
表 杠 中， 如 图 11-14 所 示 。 


个 案 标 主体 据 (C): 
凶 


0 

旧作 Ozg @@1 过 日 加 加 

显示 显示 

| 网 统计 加 图 国 绪 id 网 图 
EIEICDIENEN 

图 11-13 “系统 聚 类 分 析 ” 对 话 杠 图 11-14 系统 聚 类 分 析 变量 选择 


3) 设置 相应 的 选项 。 

(D “ 聚 类 ”选项 组 。 该 选项 组 用 于 设置 分 层 聚 类 的 方法 ， 选 中 “个 案 ” 单 选 按钮 ， 则 进 
行 Q 型 聚 类 ; 选中 “变量 ” 单 选 按钮 ， 则 进行 R 型 聚 类 。 

@ “显示 ”选项 组 。 该 选项 组 用 于 设置 输出 的 内 容 ， 选 中 “统计 ” 复 选 框 ， 系 统 将 输出 
相关 的 统计 量 ; 选中 “图 ” 复 选 框 ， 系 统 将 输出 聚 类 图 形 。 

@@ “统计 ”按钮 。 单 击 “ 统 计 ” 按 钮 ， 弹 出 如 图 11-15 所 示 的 “系统 聚 类 分 析 : 统计 ” 


。 “集中 计划 ” 复 选 框 : 选中 该 复 选 框 表示 输出 每 一 步 聚 类 过 程 中 被 合并 的 类 及 类 间距 离 。 


279 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


“近似 值 拭 阵 ” 复 选 框 : 选中 该 复 选 杠 表 示 输 出 聚 类 中 不 同 观测 之 间 的 距离 矩阵. 
“ 聚 类 成 员 ” 选 项 组 : 该 选项 组 用 于 设置 聚 类 成 员 所 属 分 类 的 输出 。 选中 “无 ” 单 选 按钮， 
则 表示 不 输出 聚 类 成 员 所 属 的 分 类 ; 选中 “单个 解 ” 单 选 按钮 ， 则 当 聚 类 数 等 于 用 户 指定 
的 数量 时 系统 输出 聚 类 成 员 所 属 的 分 类 ; 选中 “ 解 的 范围 ” 单 选 按钮 ， 则 当 聚 类 数位 于 用 
户 指定 的 范围 内 时 系统 输出 聚 类 成 员 所 属 的 分 类 。 

@ “图 ” 按钮 。 单 击 “ 图 ” 按钮， 弹出 如 图 11-16 所 示 的 “系统 聚 类 分 析 : 图 ”对 话 框 。 


蛤 系统 聚 类 分 析 : 统计 x 


图 11-15 “系统 聚 类 分 析 : 统计 ”对 话 框 图 11-16 “系统 聚 类 分 析 : 图 ”对 话 框 

该 对 话 框 用 于 设置 输出 的 聚 类 图 形 。 

。 “谱系 图 ” 复 选 框 : 选中 该 复 选 框 表示 输出 聚 类 谱系 图 ， 聚 类 谱系 图 给 出 了 类 的 合并 与 距 
离 的 相关 信息 。 下 和 


ane ET 本 

浊 伍 

ca El 
Fw: 四 #®: 医 


。 “ 冰 柱 图 ”选项 组 : 选中 项 组 用 于 设置 输出 的 冰 
柱 图 的 相关 参数 。 选 中 “全 部 聚 类 ” 单 选 按钮 ， 
输出 的 冰 柱 图 将 包括 聚 类 过 程 中 每 一 步 的 信息 ; 
选中 “指定 范围 内 的 聚 类 ” 单 选 按钮 ， 系 统 输 出 


的 冰 柱 图 则 只 包括 用 户 指定 范围 的 聚 类 数 ， 用 户 | 2 
可 以 在 下 方 的 文本 框 中 输入 聚 类 数 的 范围 ; 选中 a | Hai 
“无 ” 单 选 按钮 ， 系 统 不 输出 冰 柱 图 。 转 接 入 苇 按时 
此 外 ， 用 户 还 可 以 通过 “方向 ”选项 组 来 设置 冰 | ”9 ee 
图 区 加 重新 标 度 到 0-1 范围 E) 


柱 图 的 输出 方向 。 
回 “方法 ”按钮 。 单 击 “ 方 法 ”按钮 ， 弹 出 如 图 

11-17 所 示 的 “系统 聚 类 分 析 : 方法 ”对 话 框 。 - 
该 对 话 框 用 于 设置 聚 类 分 析 的 相关 方法 。 图 1147 “系统 聚 类 分 析 : 方法 ”对 话 框 


“ 聚 类 方法 ”下 拉 列 表 框 : 该 下 拉 列 表 框 中 给 出 了 聚 类 分 析 的 不 同方 法 ， 包 括 组 问 联接 、 
组 内 联接 、 最 近邻 元 素 、 最 远 令 元素、 质心 聚 类 、 中 位 数 聚 类 和 瓦尔 德 法 7 种， 用户 可 以 


根据 数据 的 特征 选择 相应 的 方法 。 
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。 “测量 ”选项 组 : 该 选项 组 用 于 设置 聚 类 分 析 中 距离 的 计算 方法 ， 用 户 可 以 根据 数据 的 类 
型 选择 相应 的 单 选 按钮 。 
> “区 间 ” 单 选 按钮 用 于 一 般 的 等 间隔 测量 变量 ， 其 后 的 下 拉 列 表 框 中 提供 了 8 种 距离 
选项 : 欧式 距离 、 平 方 欧式 距离 、 余 弦 、 皮 尔 逊 相关 性 、 切 比 雪 夫 、 块 、 明 可 夫 斯 基 、 
和 定制 。 除 此 之 外 ， 用 户 还 可 以 利用 “ 矫 ” 和 “ 根 ” 文 本 框 自 定义 距离 。 

> “计数 ” 单 选 按钮 用 于 计数 变量 ， 其 后 的 下 拉 列 表 框 中 给 出 了 两 种 测量 距离 的 方法 : 
卡 方 测量 和 Phi 平方 测量 

> “二 元 ” 单 选 按钮 用 于 二 值 变量 ， 用 户 可 以 在 “存在 ”和 “不 存在 ”文本 框 中 输入 二 
值 变量 的 参数 特征 ， 并 在 下 拉 列 表 框 中 选择 相应 的 距离 。 

。 “转换 值 ” 选 项 组 :该 选项 组 用 于 设置 对 数据 进行 标准 化 的 方法 ， 用 户 可 以 在 “标准 化 ”下 拉 
列表 框 中 选择 相应 的 标准 化 方法 。 此 外 ， 用 户 还 要 根据 进行 的 聚 类 类 型 选择 “ 按 个 案 ” 和 “ 按 
变量 ” 单 选 按钮 ，“ 按 个 案 ” 单 选 按钮 用 于 及 型 聚 类 ，“ 按 变量 ” 单 选 按钮 用 于 Q 型 聚 类 。 

。 “转换 测量 ”选项 组 : 该 选项 组 用 于 设置 将 计算 得 到 的 距离 进行 转换 的 方法 。 选 中 “绝对 
值 ” 复 选 框 ， 表 示 取 距离 的 绝对 值 ; 选中 “更 改 符号 ” 复 选 框 ， 表 示 交 换 当 前 的 距离 大 4 
排序 ; 选中 “重新 标 度 到 0-1 范围 ” 复 选 框 ， 表 示 将 距离 差 按 比 例 缩放 到 0-1 的 范围 内 。 

@ “保存 ”按钮 。 单 击 “ 保 存 ” 按 钮 ， 弹 出 如 图 11-18 所 示 
的 “系统 聚 类 分 析 : 保存 ”对 话 框 。 

该 对 话 框 主要 用 于 聚 类 信息 的 保存 设置 。 选 中 “无 ” 单 选 按 
钮 ， 表 示 不 保存 聚 类 结果 信息 ; 选中 “单个 解 ” 单 选 按钮 ， 表 示 
将 某 一 步 的 聚 类 结果 信息 保存 到 新 变量 ; 选中 “ 解 的 范围 ” 单 选 
按钮 表示 将 一 定 聚 类 步 数 范围 内 的 聚 类 结果 信息 保存 到 新 变量 。 

4) 分 析 结果 输出 。 设 置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 
SPSS Statistics 结果 窗口 得 到 分 层 聚 类 分 析 的 结果 。 


实验 棍 
11.3.3 “实验 操作 图 11-18 “系统 聚 类 分 析 : 
下 面 仍 以 数据 文件 “11-1” 为 例 ， 讲 解 分 层 聚 类 分 析 的 具体 操 保存 ”对 话 框 
作 过 程 并 对 输出 结果 进行 说 明 。 
1. 实验 数据 描述 
数据 文件 “11-1” 已 经 在 11.2.3 节 中 进行 了 详细 描述 ， 在 此 不 再 装 述 。 
2. 实验 操作 步骤 
GE 在 荣 单 栏 中 选择 “分 析 ”| “分 类 ”| “系统 聚 类 ”命令 ， 弹 出 “系统 聚 类 分 析 ” 对 话 框 。 
《GE962， 从 源 变量 列表 框 中 选择 “粮食 ”“ 瓜 果 ”“ 蔬 菜 ”“ 棉 花 "“ 烟 草 ”“ 油 料 ” 和“ 糖 料 ” 
变量 ， 然 后 单 击 国 按 钮 将 它们 选 入 “变量 ”列表 框 中 ， 从 源 变量 列表 框 中 选择 “地 
区 ”变量 ， 然 后 单 击 国 按 钮 将 其 选 入 “个 案 标注 依据 ”列表 框 中 。 
ES68 在 “ 聚 类 ”选项 组 中 选中 “个 案 ” 单 选 按钮 。 
G50” 单 击 “ 图 ” 按钮， 弹出 “系统 聚 类 分 析 : 图 ”对 话 框 ， 选 中 “谱系 图 ” 单 选 按钮 
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GE505 单 击 “ 方 法 ”按钮 ， 弹 出 “系统 聚 类 分 析 : 方法 ”对 话 框 ， 在 “ 聚 类 方法 ”下 拉 列 
表 框 中 选择 “质心 聚 类 ”。 
GE565 单 击 “确定 ”按钮 ， 即 可 输出 分 层 聚 类 分 析 的 结果 ， 如 图 11-19 和 图 11-20 所 示 。 


使 用 质心 联接 的 请 系 图 
rene 


一 


图 11-19 分 层 聚 类 分 析 的 冰 柱 图 11-20 ” 聚 类 分 析 谱 系 图 


分 层 聚 类 分 析 的 冰 柱 图 给 出 了 各 类 之 间 的 距离 , 从 最 后 一 行 向 前 我 们 可 以 依次 看 出 不 同 的 
聚 类 数量 下 的 分 类 方式 。 


上限 类 分 析 树 形 图 给 出 了 聚 类 每 一 次 合并 的 情况 。 

结合 聚 类 分 析 树 形 图 ， 建 议 分 为 四 类 : 福建、 广东、 浙江、 海南、 北京、 广西 、 天 津 、 
上 海 8 个 省 市 归 为 一 类 , 经 济 作物 在 其 种 植 中 占 较 大 比例 ; 新 疆 自治 区 归 为 一 类 ,棉花 的 种 植 
在 其 种 植 结构 中 占据 了 重要 的 比重 ; 青海 省 归 为 一 类 , 其 种 植 特征 不 明显 ; 其 他 省 市 归 为 一 类 ， 
粮食 作物 在 其 种 植 结构 中 占 统 治 地 位 。 通 过 聚 类 分 析 我 们 可 以 清楚 地 区 分 各 个 省 市 的 农业 种 植 
结构 差异 。 


11.4 两 阶段 聚 类 分 析 


两 阶段 聚 类 分 析 方法 可 以 揭示 数据 内 部 的 自然 分 组 ， 其 运用 信息 准则 确定 最 优 的 分 组 格 
式 并 依据 距离 形成 聚 类 特征 树 进行 分 组 。 
11.4.1 两 阶段 聚 类 分 析 简 介 


两 阶段 聚 类 分 析 主 要 包括 以 下 两 步 : 首先 以 距离 为 依据 形成 相应 的 聚 类 特征 树 结 点 从 而 
构造 聚 类 特征 树 ， 然 后 通过 信息 准则 确定 最 优 分 组 个 数 对 各 个 结 点 进行 分 组 。 两 阶段 聚 类 分 析 
具有 能 够 同时 处 理 分 类 变量 和 连续 变量 、 自 动 选择 最 优 分 类 个 数 、 大 样本 数据 下 表现 优异 的 特 
点 ， 在 分 析 中 具有 广泛 的 应 用 。 
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11.4.2 ”两 阶段 聚 类 分 析 的 SPSS 操作 


建立 或 打开 相应 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 进行 两 阶段 聚 类 
分 析 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 分 类 ”|“ 二 阶 聚 类 ”命令 ， 打 开 如 图 11-21 所 示 的 “二 阶 

2) 选择 变量 。 从 源 变量 列表 框 中 选择 参与 聚 类 分 析 的 目标 变量 ， 将 选中 的 变量 选 入 “ 连 
续 变 量 ”列表 框 中 ， 从 源 变 量 列表 框 中 选择 属 类 变量 ， 将 选中 的 变量 选 入 “分 类 变量 ”列表 杠 
中 ， 如 图 11-22 所 示 。 


待 标准 化 计 趣 : 
假定 标准 化 计数 : 


办 类 准则 
图 施 矶 喜 风 时 斯 准则 (BIC) 
日 刘 二 信息 准 R| WAIC) 


图 11-21 “二 阶 聚 类 分 析 ” 对 话 框 11-22 ”二 阶 聚 类 分 析 的 变量 选择 

3) 设置 相应 的 选项 。 

@ “距离 测量 ”选项 组 。 该 选项 组 用 于 设置 距离 的 测量 方法 ， 选 中 “对 数 似 然 ” 单 选 按 
钮 ， 系 统 使 用 对 数 似 然 距离 ; 选中 “ 欧 氏 ” 单 选 按钮 ， 则 使 用 欧式 距离 ， 欧 式 距离 的 选择 必须 
以 所 有 变量 皆 是 连续 变量 为 前 提 。 

@“ 聚 类 数目 ”选项 组 。 该 选项 组 用 于 设置 聚 类 的 数量 , 选中 “自动 确定 ” 单 选 按 钮 , SPSS 
将 自动 选择 最 优 的 聚 类 数量 ， 用 户 也 可 以 选中 “指定 固定 值 ” 单 选 按钮 自 定 义 聚 类 的 数量 。 

@ “连续 变量 计数 ”选项 组 。 该 选项 组 显示 对 连续 变量 进行 标准 化 处 理 的 相关 信息 。 对 
一 个 变量 是 否 进行 标准 化 处 理 的 设置 ， 本 书 会 在 后 面 做 详细 介绍 。 

加“ 聚 类 准则 ”选项 组 。 该 选项 组 用 于 设置 确定 最 优 聚 类 数量 的 准则 , 用 户 可 以 选择 AIC 
或 BIC 准则 。 

加 “选项 ”按钮 。 单 击 “ 选 项 ”按钮 ， 弹 出 如 图 11-23 所 示 的 “二 阶 聚 类 : 选项 ”对 话 框 。 


。 “ 离 群 值 处 理 ” 选 项 组 : 该 选项 组 用 于 设置 当 聚 类 特征 (CF ) 树 填 满 的 情况 下 对 离 群 值 的 
处 理 方式 。 如 果 选 中 “使 用 噪声 处 理 ” 复 选 框 ， 系 统 会 将 离 群 值 合并 为 一 个 单独 的 “噪声 ” 
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叶 ， 然 后 重新 执行 聚 类 特征 ( CF ) 树 的 生长 过 程 。 用户 可 以 在 “百分比 ”文本 框 中 设置 离 
群 值 的 判定 标准 。 

。 “内 存 分 配 ” 选 项 组 : 该 选项 组 用 于 设置 聚 类 过 程 中 所 占用 的 最 大 内 存 数 量 ， 溢 出 的 数据 
将 调用 硬盘 作为 缓存 来 进行 存储 。 

。 “连续 变量 标准 化 ”选项 组 : 该 选项 组 用 于 设置 一 个 变量 是 否 进行 标准 化 处 理 。 用 户 可 以 
选择 那些 已 经 是 或 是 假定 为 标准 化 的 变量 ， 单 击 国 按 钮 将 其 选 入 “假定 标准 化 计数 ”列表 
框 中 ， 表 示 不 再 对 它们 进行 标准 化 处 理 ， 以 节省 处 理 时 间 。 

。 “高 级 ”按钮 : 单 击 该 按钮 会 展开 高 级 选项 ， 主 要 用 于 设置 聚 类 特征 数 的 调整 准则 。 

@ “输出 ”按钮 。 单 击 “ 输 出 ”按钮 ， 打 

开 如 图 11-24 所 示 的 “二 阶 聚 类 : 输出 对话 框 。 


蛤 二 阶 权 类 : 选项 


本 了 人 处理 一 一 一 一 一 一 「 由 分 
| 


连续 突 电 标准 化 
候 定 标准 化 计 歼 他): 竺 标准 化 计数 四; 

bibs 
加 依 洋 六 

议 扶 睦 

多 虽 孙 


EOB | | 
图 11-23 “二 阶 聚 类 : 选项 ”对 话 框 图 11-24 “二 阶 聚 类 : 输出 ”对 话 框 
该 对 话 框 用 于 设置 两 阶段 聚 类 的 输出 选项 。 
。 “工作 数据 文件 ”选项 组 : 该 选项 组 用 于 结果 保存 的 设置 ， 如 选中 “创建 聚 类 成 员 变 量 ” 
复 选 框 ， 聚 类 结果 将 作为 变量 保存 。 


。 “XML 文件 ”选项 组 : 用 户 可 以 通过 设置 该 选项 组 ,以 XML 文件 的 格式 输出 最 终 聚 类 模 
型 和 聚 类 特征 (CF ) 树 。 


4) 分 析 结果 输出 。 
设置 完毕 后 ， 单 击 “确定 ”按钮 ， 即 可 在 SPSS Statistics 结果 窗口 得 到 两 阶段 聚 类 分 析 的 


11.4.3 ”实验 操作 


下 面 以 数据 文件 “11-2” 为 例 ， 讲 解 两 阶段 聚 类 分 析 的 具体 操作 过 程 并 对 输出 结果 进行 说 明 。 
1. 实验 数据 描述 


数据 文件 “11-2” 是 某 地 水 资源 调查 的 结果 , 调查 人 员 选 取 了 14 处 饮水 泉 和 15 处 饮水 井 ， 


化 验 了 水 中 钙 、 镁 、 铁 、 锰 、 铜 的 含量 。 本 实验 采用 两 阶段 聚 类 方法 分 析 该 地 区 水 源 的 特征 。 
本 实验 的 原始 数据 如 图 11-25 所 示 。 
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E26 


A B © 5 EE 
水 源 类 型 钙 (毫克 ) 圈 (毫克 ) 铁 (毫克 ) 乱 (至 克 ) 
| 果 水 EL] ET 4487 0012 


11-25 ”数据 文件 “11-2” 原 始 数据 
在 SPSS 的 变量 视图 中 建立 “水 源 类 型 ”变量 , 表示 取水 来 源 的 类 型 , 建立 “ 钙 ”“ 镁 ”“ 铁 ” 
“ 锰 ” 和 “ 铜 ”变量 ， 表 示 各 种 元 素 的 含量 ， 其 中 “水 源 类 型 ”变量 分 别 用 “1、2” 代 表 “ 录 
水 、 井 水 ” 如 图 11-26 所 示 。 


起 ,而 全 忻 sav 玫 扣 和 1] 有 BM SPSS Statistics 数控 闹 护 着 一 口 x 
文件 (E] 坊 畏 (E) 二 看 未 据 (D) 转换 中 分析 的) 直 消 书本 形 (8) 实用 程序 ) 扩 堪 &) 窗口 QW) 帮助 人 H) 
= re -a 有 的 | | 


EM SPSS Statistics 外 天 程序 直线 | | TUnicode ON| I 


11-26 数据 文件 “11-2” 的 变量 视图 

在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 
数据 如 图 11-27 所 示 。 
2. 实验 操作 步骤 

ES6) 在 菜单 栏 中 选择 “分 析 ”|“ 分 类 ”| “二 阶 聚 类 ”命令 ， 打 开 “ 二 阶 聚 类 分 析 ” 对 话 框 。 

本 VD》 从 源 变量 列表 框 中 选择 “ 钙 ”“ 镁 ”“ 铁 ”“ 锰 ”和 “ 铜 ”变量 ， 单 击 园 按 钮 将 它们 选 

入 “连续 变量 ”列表 框 中 ; 从 源 变量 列表 框 中 选择 “水 源 类 型 ”变量 ， 将 其 选 入 “分 

类 变量 ”列表 框 中 。 
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TR ES EM SPss statirtics SSE 


- oO 


2 全 大 0 友基 二 晤 参 上 


图 11-27 数据 文件 “11-2” 的 数据 视图 


ES63 单 击 “ 输 出 ”按钮 打开“ 二 阶 聚 
类 : 输出 ”对 话 框 ， 选 中 “创建 聚 
类 成 员 变量 ” 复 选 框 , 单 击 “ 继 续 ” 
按钮 。 

GE365 单 击 “ 确 定 ” 按 钮 ， 即 可 输出 两 阶段 
聚 类 分 析 的 结果 ， 如 图 11-28 所 示 。 


3. 实验 结果 分 析 


聚 类 质量 


图 11-28 给 出 了 两 阶段 聚 类 的 模型 概要 ， 
我 们 发 现 根据 BIC 准则 ， 样 本 被 聚 成 了 两 类 。 。 .a 
与 此 同时 , 在 原始 数据 中 新 建 了 变 理 TSC-7592 
保存 具体 的 样本 聚 类 结果 ， 如 图 11-29 所 示 。 


00 
比 肥 和 分 离 的 轮廓 测 重 


11-28 信息 准则 输出 


闪现 各 分 ff sov 政 表 从] -IBM 5pS5 Statistcs 关 尖 风纪 中 


11-29 ” 聚 类 分 布 
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通过 聚 类 分 析 我 们 可 以 看 出 ， 该 地 区 的 水 源 按照 元 素 含量 主要 可 以 分 为 两 大 类 型 ， 第 二 
类 水 源 的 各 种 元 素 的 含量 均 低 于 第 一 类 。 通 过 聚 类 分 析 输 出 可 以 看 出 ， 泉 水 全 部 属于 第 一 类 ， 
井 水 全 部 属于 第 二 类 ， 由 此 可 以 见 ， 水 中 微量 元 素 的 差异 主要 与 水 源 类 型 有 关 。 


11.5 上 机 题 


视频 文件 ，\video\ 上 机 题 教学 视频 \chap11.wmv 


全 视频 文件 : \sample\ 上 机 题 \chapll\… 


11.1 为 了 更 加 深入 地 了 解 我 国人 口 的 文化 程度 状况 ， 现 采集 2000 年 全 国人 口 普查 数据 
中 全 国 30 个 省 、 直 辖 市 、 自 治 区 的 人 口 文化 程度 的 数据 。 观 测 选用 了 三 个 指标 : 〈1) 大 学 以 
上 文化 程度 的 人 口 占 全 部 人 口 的 比例 (DXBZ) ， (2) 初中 文化 程度 的 人 口 占 全 部 人 口 的 比 
例 (CZBZ) ， (3) 文盲 半 文 盲人 口 占 全 部 人 口 的 比例 C(WMBZ) ， 分 别 用 来 反映 较 高 、 中 
等 、 较 低 文 化 程度 人 口 的 状况 ， 观 测 数据 如 下 表 所 示 。 


地 区 WMBZ (%) 
北京 1 93 30.55 8.7 
天 津 2 4.7 29.38 8.9 
河 北 3 1 24.69 瑰 光 
山 西 4 1.4 29.24 11.3 
内 蒙 5 ES 25.47 15.4 
这 字 6 2.6 32.32 8.8 
吉 林 7 22 26.31 10.5 
黑龙 江 8 2 28.46 10.9 
上 海 9 6.5 31.59 11 
江 苏 10 1.5 26.43 2 
浙 江 11 i2 23.74 17.5 
安 徽 12 0.9 19.97 24.4 
福 建 季 区 16.87 15.6 
江 西 14 | 18.84 16.2 
山 东 15 1 25.18 16.9 
河 南 16 0.9 26.55 16.2 
河 北 17 1.6 23.16 15.8 
湖 南 18 下 22.57 12.1 
广 东 19 1.3 23.04 10.5 
广西 20 0.8 19.14 10.6 
海 南 | 1.2 22.53 14 
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( 续 表 ) 

地 区 序号 DXBZ (%) CZBZ (%) WMBZ (%) 
川 22 1 21.65 16.2 
贵 州 23 0.8 14.65 24.3 
云 南 24 0.8 13.85 25.4 
西 藏 25 0.6 3.85 44.4 
陕 西 26 1.7 24.36 17.6 
甘 肃 27 Lt 16.85 27.9 
青海 28 1.5 17.76 27.7 
宁 夏 29 1.6 20.27 223 
新 经 1.9 20.66 


为 了 科学 评价 各 地 区 人 口 文化 状况 , 以 便 为 教育 文化 投资 的 流向 和 政策 的 制定 提供 合理 的 
依据 ， 我 们 需要 对 各 省 区 进行 分 类 ， 试 采用 系统 聚 类 法 对 我 国人 口 文化 状况 进行 聚 类 分 析 。 

11.2 某 地 教育 部 门 对 十 五 所 中 学 的 师资 力量 、 硬 件 条 件 和 生源 质量 进行 了 调查 ， 并 给 
出 了 相应 的 得 分 ， 数 据 如 下 表 所 示 。 


师资 力量 得 分 序号 
98.82 85.49 93.18 1 
85.37 79.1 99.65 全 
89.64 80.64 96.94 3 
73.08 86.82 98.7 4 
78.73 80.44 97.61 5 
103.44 80.4 93.75 6 
91.99 80.77 99.93 
87.5 82.5 84.1 8 
81.82 88.45 973 号 
73.13 82.94 92.12 10 
86.19 83.55 %39 11 
72.48 78.12 72.38 12 
58.81 86.2 83.46 13 
72.48 84.87 84.09 14 
90.56 82.07 87.15 15 


该 地 教育 局 希望 推动 不 同 层次 的 学 校 之 间 教 师 的 交流 ， 我 们 希望 对 十 五 所 学 校 进行 分 类 ， 


确定 其 所 属 的 层次 ， 试 用 分 层 聚 类 方法 ， 对 这 十 五 所 中 学 进行 分 类 。 
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11.3 ” 某 整 形 医院 外 科 收 集 了 300 例 耳 缺损 病例 的 外 形 测量 数据 ， 部 分 数据 如 下 表 所 示 。 


耳 廓 (mm) 耳蜗 (mm) 耳垂 (mm) 
6.6 3.5 1.9 
5.9 3 2 
6 3.4 2 
6.6 3 2 
6.6 3.2 2 
5.5 3 1.8 
$7 3 1.8 
6 Ee 
5.9 2.1 
6.5 2 
5.8 LY 
$7 2 
$5 2 
7.6 于 
6.7 Re 
62 25 
62 2 
6.6 Zz 
5.4 Ls 
6.9 2 
59 1.8 
Th i 
Ts 2.2 
6.2 1.6 
和 1 1.8 
5.6 I 
6.2 Ls 
7.4 2.6 
63 19 


试 根据 这 些 数 据 生 成 4 类 标准 耳 型 以 便 用 于 整形 分 析 ( 数 据 源 于 《医学 统计 学 与 电脑 实验 》 
方 积 乾 主编 ) 。 
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判别 分 析 是 在 分 类 数目 己 知 的 情况 下 ,根据 已 经 确定 分 类 的 对 象 的 某 些 观测 指标 和 所 属 类 
别 来 判断 未 知 对 象 所 属 类 别 的 一 种 统计 学 方法 。 与 聚 类 分 析 有 所 不 同 的 是 ,判别 分 析 法 首先 需 
要 对 所 研究 对 象 进行 分 类 , 进一步 选择 若干 对 观测 对 象 能 够 较 全 面 描述 的 变量 , 然后 按照 一 定 
的 判别 准则 , 建立 一 个 或 多 个 判别 函数 ,利用 研究 对 象 的 大 量 资料 确定 判别 函数 中 的 待定 系数 ， 
并 计算 判别 指标 。 对 一 个 未 确定 类 别 的 个 案 只 要 将 其 代入 判别 函数 就 可 以 判断 它 属 于 哪 一 类 
总 体 。 


12.1 一 般 判 别 分 析 


与 聚 类 分 析 不 同 , 判别 分 析 是 在 分 组 已 知 的 前 提 下 , 根据 相应 的 指标 对 不 知 类 别 的 观测 量 
12.1.1 一 般 判 别 分 析 简 介 

一 般 判 别 分 析 是 在 已 知 分 类 的 前 提 下 ,对 未 知 分 类 的 观测 量 归 入 已 有 分 类 的 一 种 多 元 统计 
分 析 方 法 。 判别 分 析 法 的 思路 如 下 : 首先 建立 判别 函数 ; 然后 通过 已 知 所 属 分 类 的 观测 量 确定 
判别 函数 中 的 待定 系数 ; 最 后 通过 该 判别 函数 对 未 知 分 类 的 观测 量 进行 归 类 。 常用 的 判别 分 析 
方法 有 距离 判别 法 、 费 舍 尔 判别 法 和 贝 叶 斯 判别 法 。 

费 舍 尔 判别 法 利用 投影 的 方法 使 多 维 问题 简化 为 一 维 问题 来 处 理 。 其 通过 建立 线性 判别 函 
数 计算 出 各 个 观测 量 在 各 典型 变量 维度 上 的 坐标 并 得 出 样本 距离 各 个 类 中 心 的 距离 , 以 此 作为 
分 类 依据 。 

贝 叶 斯 判别 法 通过 计算 待 判定 样品 属于 每 个 总 体 的 条 件 概率 并 将 样本 归 为 条 件 概率 最 大 
的 组 。 其 主要 思想 如 下 : 首先 利用 样本 所 属 分 类 的 先 验 概率 通过 贝 叶 斯 法 则 求 出 样本 所 属 分 类 
后 验 概率 ， 并 依据 该 后 验 概率 分 布 作出 统计 推断 。 

距离 判别 思想 是 根据 各 样品 与 各 母体 之 间 的 距离 远近 作出 判别 的 。 其 通过 建立 关于 各 母体 
的 距离 判别 函数 式 , 得 出 各 样品 与 各 母体 之 间 的 距离 值 ,判别 样品 属于 距离 值 最 小 的 那个 母体 。 


12.1.2 一 般 判别 分 析 的 SPSS 操作 

打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 一 般 判别 分 析 。 

1) 在 菜单 栏 中 选择 “分 析 ”| “分 类 ”|“ 判 别 式 ”命令 ， 打 开 如 图 12-1 所 示 的 “判别 分 
析 ” 对 话 框 。 

2) 选择 变量 。 从 源 变 量 列表 框 中 选择 参与 判别 分 析 的 目标 变量 ， 然 后 单 击 国 按 钮 将 选中 
的 变量 选 入 “ 自 变量 ”列表 框 中 ， 从 源 变 量 列表 框 中 选择 分 类 变量 ， 然 后 单 击 国 按钮 将 选中 
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的 变量 选 入 “分 组 变量 ”列表 框 中 ; 对 于 选 入 “选择 变量 ”列表 框 中 的 变量 , 用 户 可 以 单 击 “ 值 ” 
按钮 输入 相应 的 数值 ， 系 统 将 只 对 含有 此 观测 值 的 变量 进行 分 析 ， 如 图 12-2 所 示 。 
前 #3 析 
SG): 四 分 组 变量 (G): 
J | 区 二 em 
从 当前 地 址 居住 年 限 [ 去 量 由 : EE 
太守 加 入 ( 千 元 ) [ 
Zao | 国 a gs, es 
| Se S 
| 国政 一 
G3) 7- Ege Be) ESE 
图 12-1 “判别 分 析 ” 对 话 框 图 12-2 ”判别 分 析 变 量 选择 
“ 自 变量 ”列表 框 下 的 “一 起 输入 自 变量 ”和 “使 用 步 进 法 ”两 个 单 选 按钮 用 来 决定 判别 


分 析 的 类 型 ， 如 使 用 一 般 判 别 分 析 ， 则 选中 “一 起 输入 自 变 量 ” 单 选 按钮 。 

3) 设置 相应 的 选项 。 

Q@ “定义 范围 ”按钮 。 当 分 类 变量 选择 完毕 后 ， 该 按钮 被 激活 。 单 击 “ 定 义 范围 ”按钮 ， 
弹出 如 图 12-3 所 示 的 “判别 分 析 : 定义 范围 ”对 话 框 。 


该 对 话 框 用 于 确定 分 类 变量 的 范围 ,用 户 需 要 在 “最 小 值 ”和 “最 大 值 ”文本 框 中 输入 相 
应 的 范围 。 


@“ 统 计 ” 按 钮 。 单 击 “ 统 计 ” 按 钮 ， 弹 出 如 图 12-4 所 示 的 “判别 分 析 : 统计 ”对 话 框 。 


埠 判 中 分 析 : 统计 


据 述 一 一 
加 

回 单 变量 ANOVA 
器 博克 斯 MB) 
国 数 系 数 一 一 一 

回 更 希 尔 ( 
回 未 标准 化 (U) 


[EEsGjLan La] 

图 12-3 “判别 分 析 : 定义 范围 ”对 话 框 图 12-4 “判别 分 析 : 统计 ”对 话 框 

。 “描述 ”选项 组 : 该 选项 组 用 于 进行 描述 性 统计 量 的 输出 设置 。 选 中 “平均 值 ” 复 选 框 ， 
系统 将 输出 各 变量 的 均值 与 方差 ; 选中 “ 单 变量 ANOVA” 复 选 框 ， 系 统 将 输出 单 变量 方 
差分 析 的 结果 ; 选中 “博克 斯 M” 复 选 框 ， 系 统 将 输出 对 组 协 方差 矩阵 的 等 同性 检验 的 
检验 结果 。 

。 “函数 系数 ”选项 组 : 该 选项 组 用 于 设置 判别 函数 系数 的 输出 。 选 中 “ 费 希 尔 ” 复 选 框 ， 
系统 将 输出 分 类 的 费 希 尔 分 类 函数 系数 ; 选中 “未 标准 化 ” 复 选 框 ， 系 统 将 输出 未 经 标 
准 化 处 理 的 判别 函数 系数 。 

。 “矩阵 ”选项 组 : 该 选项 组 用 于 设置 自 变 量 系数 矩阵 的 输出 ， 用 户 可 以 选择 相应 的 复 选 
框 以 输出 组 内 相关 性 、 组 内 协 方差 、 分 组 协 方差 和 总 协 方差 。 
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图 “方法 ”按钮 。 只 有 选择 “使 用 步 进 法 ” 进 ”二 芭 > 
行 逐 步 判 别 分 析 时 ， 该 按钮 才 会 被 激活 ， 故 本 书 此 处 ws er 
对 该 按钮 功能 不 作 相 关 介绍 。 Se ee 
@ “分 类 ”按钮 。 单 击 “ 分 类 ”按钮 ， 弹 出 如 = 
图 12-5 所 示 的 “判别 分 析 : 分 类 ”对 话 框 。 证 a 
。 “ 先 验 概率 ”选项 组 :该 选项 组 用 于 设置 名 组 。 二 sw 宏光 
的 先 验 概率 。 选 中 “所 有 组 相等 ” 单 选 按钮 ， | oansmomne 
表示 各 组 的 先 验 概率 相等 ， 选 中 “根据 组 大 小 故国 而 国 轿 国 
计算 ” 单 选 按钮 ， 表 示 各 组 先 验 概率 与 名 组 的 
样本 容量 成 正比 。 图 12-5 “判别 分 析 : 分 类 ”对 话 框 


@ “保存 ”按钮 。 单 击 “ 保 存 ” 按 钮 ， 弹 出 如 图 
12-6 所 示 的 “判别 分 析 : 保存 ”对 话 框 。 


“显示 ”选项 组 : 该 选项 组 用 于 设置 输出 的 内 容 。 选 中 “个 案 结 果 ” 复 选 框 ， 表 示 输 出 每 
个 观测 的 预测 组 、 实 际 组 、 后 验 概率 和 判别 得 分 ; 选中 “摘要 表 ” 复 选 框 ， 则 表示 输出 正 
确 分 类 与 错误 分 类 观测 数 及 错 分 率 ; 选中 “ 留 一 分 类 ” 复 选 框 ， 则 表示 使 用 除去 该 观测 值 
后 的 其 他 所 有 的 观测 值 生成 的 判别 函数 来 进行 分 类 。 

“使 用 协 方差 矩阵 ”选项 组 : 该 选项 组 用 于 设置 分 类 时 使 用 的 协 方差 矩阵 。 用 户 可 以 选择 
使 用 组 内 协 方差 矩阵 或 分 组 协 方差 矩阵 进行 分 类 。 

“图 ”选项 组 : 该 选项 组 用 于 设置 输出 的 统计 图 形 。 选 中 “合并 组 ” 复 选 框 ， 表 示 根 据 前 
两 个 判别 函数 的 函数 值 生成 一 张 包含 各 类 的 散 点 图 ; 选中 “分 组 ” 复 选 框 ， 表 示 根 据 前 两 
个 判别 函数 的 函数 值 对 每 一 类 分 别 生 成 一 张 散 点 图 ; 选中 “领域 图 ” 复 选 框 ， 表 示 生 成 一 
张 根据 判别 函数 的 值 将 观测 量 分 到 相应 分 组 的 边界 图 。 

“将 缺失 值 替换 为 平均 值 ” 复 选 框 : 该 复 选 框 用 于 设置 缺失 值 的 处 理 方式 。 选 中 该 复 选 框 ， 
表示 使 用 变量 的 均值 替代 该 变量 的 缺失 值 。 


x 


“预测 组 成 员 ” 复 选 框 : 选中 该 复 选 框 ,表示 将 ee i 
依据 判别 函数 值 预测 的 某 一 观测 所 属 的 分 类 信 
息 作为 一 个 新 变量 保存 。 ole 

“判别 得 分 ” 复 选 框 : 选中 该 复 选 框 ， 表 示 将 判 图 12.6 。 “判别 分 析 ， 保 存 ” 对 话 棋 
别 得 分 作为 新 变量 保存 。 

“组 成 员 概率 ” 复 选 框 : 选中 该 复 选 框 ， 表 示 将 观测 属于 某 一 组 的 概率 作为 新 变量 保存 。 

“将 模型 信息 导出 到 XML 文件 ”文本 框 : 该 文本 框 用 于 将 模型 信息 输出 到 指定 的 XML 
文件 。 用 户 可 以 在 该 文本 框 中 输入 该 XML 文件 的 路 径 。 


4) 分 析 结 果 输 出 。 设 置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 结果 窗口 得 
到 一 般 判 别 分 析 的 结果 。 


12.1.3 ”实验 操作 


下 面 将 以 数据 文件 “12-1” 为 例 ， 讲 解 一 般 判 别 分 析 的 具体 操作 过 程 并 对 输出 结果 进行 说 明 。 
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1. 实验 数据 描述 


数据 文件 “12-1” 来 源 于 SPSS 自 带 的 数据 文件 “Bank loan”， 该 数据 文件 记录 了 850 位 
过 去 和 潜在 客户 的 财务 和 人 口 统计 信息 。 前 700 个 个 案 是 以 前 曾 获得 贷款 的 客户 。 剩 下 的 150 
个 个 案 是 潜在 客户 , 获 贷款 的 客户 被 分 为 履约 和 违约 两 类 , 本 实验 将 使 用 判别 分 析 方法 来 分 析 
潜在 客户 的 贷款 风险 。 本 数据 文件 的 原始 Excel 数据 如 图 12-7 所 示 。 


A ll 加 

ET ET TE 

末 大 区 可 
27 未 成 商 中 四 
如 未 窟 商 中 
4 天 宛 反 丙 丰 


alolNlolsls clo lll 
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图 12-7 数据 文件 “12-1” 原 始 数据 

首先 在 SPSS 变量 视图 中 建立 变量 “年 龄 ” “教育 ” “工龄 ”“ 地 址 ” “收入 ”“ 负 债 率 ” 
“信用 卡 负债 ”“ 其 他 负债 ”和 “违约 ”， 分 别 用 来 表示 客户 年 龄 、 受 教育 程度 、 工 龄 、 现 地 
址 居住 时 间 、 收 入 、 负 债 率 、 信 用 卡 负债 、 其 他 负债 和 是 否 曾 违 约 。 其 中 ，“ 受 教育 程度 ” 变 
量 中 使 用 数值 “1、2、3、4、5” 分 别 表示 “未 完成 高 中 ”“ 高 中 ”“ 大 专 ” “大 学 ”和 “ 研 
究 生 ”“ 违 约 ” 变 量 用 “1、0” 分 别 表示 “ 曾 违约 ”和 “未 曾 违 约 ”， 如 图 12-8 所 示 。 


起 ‘sa 1) - BM SPSS Staristics BS es 
EC 


测量 

PH NM 和 
EE LL 
和 


洲 
四 


可 到 到 本 本 可 到 可 天 


当前 几 方 工作 
当前 地 址 居住 
宗 放 中 入 ( 千 
负债 收入 比 莘 
信用 卡 负 售 数字 信用 卡 负重 
其 他 负 依 。 趣闻 其 他 名 请 (二 
违约 者 字 是 否 曾 经 加 约 


和 
SHE NM 和 
SA 
人 和 
信 标 度 入 输入 
机 色色 NN 


EC EE EE I 


时 


BM SPSS Siafstics 外 于 和 序 波 圭 Unicoge-ON 


图 12-8 数据 文件 “12-1” 的 变量 视图 
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然后 在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 
部 分 数据 如 图 12-9 所 示 。 
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12-9 数据 文件 “12-1” 的 数据 视图 


2. 实验 操作 步骤 

实验 的 具体 操作 步骤 如 下 : 

本 了 VY 在 菜单 栏 中 选择 “分 析 ”|“ 分 类 ”| “判别 式 ”命令 ， 打 开 “ 判 别 分 析 ” 对 话 框 。 

人 GE5362 从 源 变量 列表 框 中 选择 “年 龄 ”“ 教 育 ”“ 工 龄 ”“ 地 址 ”“ 收 入 ”“ 负 债 率 ”“ 信 用 卡 
负债 ”和 “其 他 负债 ”变量 ， 单 击 国 按 钮 将 它们 选 入 “ 自 变量 ”列表 框 中 ， 从 源 变 
量 列表 框 中 选择 “违约 ”变量 ， 将 其 选 入 “分 组 变量 ”列表 框 中 。 

人 ES63 单 击 “定义 范围 ”按钮 ， 弹 出 “判别 分 析 : 定义 范围 ”对 话 框 ， 在 该 对 话 框 中 输入 
违约 变量 的 取 值 范围 0~1， 单 击 “ 继 续 ” 按 钮 。 

本 3 了 04 单 击 “ 统 计 ” 按 钮 ， 弹 出 “判别 分 析 : 统计 ”对 话 框 ， 选 中 “平均 值 ” 复 选 框 ， 单 
击 “ 继 续 ” 按 钮 。 

E305 单 击 “分 类 ”按钮 ， 弹 出 “判别 分 析 : 分 类 ”对 话 框 ， 选 中 “面积 图 ” 复 选 框 ， 单 
击 “ 继 续 ” 按 钮 。 

GE565 单 击 “ 保 存 ” 按 钮 ， 弹 出 “判别 分 析 : 保存 ”对 话 框 ,选中 “预测 组 成 员 ” 复 选 框 ， 
单 击 “继续 ”按钮 。 

GE567 单 击 “确定 ”按钮 ， 便 可 以 得 到 一 般 判 别 分 析 的 结果 。 


3. 实验 结果 及 分 析 

SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 12-10~ 图 12-16 所 示 。 

12-10 给 出 了 样本 数量 、 有 效 值 和 排除 值 的 相关 信息 。 

图 12-11 给 出 了 各 组 和 所 有 观测 的 均值 、 标 准 差 和 加 权 与 未 加 权 的 有 效 值 。 


别 分 析 


组 统计 

有 将 个 业 致 《成 网) 

是 否则 经 汗 的 平均 值 标准 差 。。 未 加权 “| 加 权 
秀 年 答 35.5145 7.70774 517 517.000 
教育 本 在 1.6596 .90443 517 517.000 
襄 甬 奉 方 工作 年 哄 95087 6 66374 517 517.000 
ET 8.9459 。 7.00062 517 517.000 
家 旗 履 入 《 咎 元 ) 471547 3422015 517 517.000 
从 KAI 本 Ga00) 86793 5.61520 517 517.000 
信用 卡 负 僵 《 千 元 ) 12455 1.42231 517 517.000 
其 他 负债 《 千 元 ) 27734 3281394 517 ”517.000 
是 年内 330109 。 8.51759 193 183.000 
教育 本 干 19016 97279 183 183.000 
雪 前 直方 工作 年 隐 52240 5.54295 183 183.000 
入 前 地 址 局 住 年 共 63934 5.92521 183 183.000 
分 析 个 案 处 理 摘要 之 委 收 入 《下 元 》 412131 4311553 193 193.000 
碳 陡 校 入 论著 (xi00》 ”14.7279 7.90280 183 183.000 
_ 本 加 权 个 案 获 个 家 数 | 百分比 RN CRE 24239 323252 183 183000 
有 效 700 824 KEAR ER 39626 4.26368 183 183.000 
排除 ”缺失 或 超出 范围 组 代码 150 176 总 计 。 年 办 34.8600 7.99734 700 700.000 
Ye T 教育 本 闪 17229 .92821 700 700.000 
0 2 名 前 证 方 工作 年 由 8.3886 665804 700 700.000 
rr 0 1 汉 格 地 址 居 信 年限 82786 6.82488 700 700.000 
A 家 庭 收 入 《于 元 ) 455014 3681423 700 700.000 
和 T 人 了 性 和 WE 者 xf00》 102606 6.82723 700 700000 
一 = 1 17.6 信用 不 仙 俱 《 千 元 》 15536 2411720 700 700.000 
总 计 850 1000 其 人 负债 《和 元 ) 30582 3.28755 700 700.000 

12-10 ”个案 综合 处 理 摘要 12-11 组 统计 量 


12-12 给 出 了 威 尔 克 的 Lambda 检验 的 结果 。 从 检验 结果 可 以 看 出 ， 引 入 的 变量 对 提高 
分 类 精度 是 有 作用 的 。 


特征 值 威 尔 克 Lambda 
函数 特征 值 方差 百分比 累计 百分比 ”类型 相关 性 琶 尔 克 
1 4053 1000 1000 Ch eM El 生生 全 二 
a, 在 分 析 中 使 用 了 前 1 个 典 则 判别 函数 。 B72 | 23017 | 8| .000 


12-12 ”判别 分 析 的 运行 记录 


12-13 给 出 了 判别 函数 的 系数 与 结构 矩阵 ， 我 们 可 以 看 出 ， 所 有 变量 均 在 判别 分 析 中 
使 用 。 


结构 矩阵 
项 数 
i 1 
标准 化 典 则 判别 函数 系数 RA 
ee 当前 让 方 工人 年限 
从 CF 居 
2 当前 地 址 居住 年 限 
教育 本 于 其 他 负 使 ( 千 元 ) 
当前 认 方 工作 年 风 a 
站 居住。 ee 
家 放 收 入 ( 千 元 ) i 
交合 收 入 比率 0d00) 剂 时 变 重 与 标准 化 由 则 判 曙 届 数 之 
信用 卡 负债 《二 元 ) .568 。。 同 的 汇 可 组 内 相关 性 
es 二 65” 。。 变量 按 二 数 内 相关 人 的 抱 对 大 小 排 


图 12-13 ”判别 函数 系数 与 结构 矩阵 
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图 12-14 给 出 了 组 质心 处 的 判别 函数 值 。 图 12-15 给 出 了 两 个 组 的 先 验 概率 。 


组 质心 处 的 函数 组 的 先 验 概率 
二 数 在 分 村 中 使 用 的 个 案 
是 知名 经 连 约 1 是 下 曾经 违约 先 验 未 加权 加 权 
理 -378 下 500 517 ”517.000 
3 TD 是 500 183 183.000 
tt 总 计 1.000 700 “700.000 
图 12-14 组 质心 处 函数 值 12-15 ”组 的 先 验 概率 


预测 的 分 组 结果 作为 新 的 变量 被 保存 , 从 中 可 以 看 出 这 150 位 潜在 客户 所 处 的 信用 等 级 分 
组 ， 还 可 以 看 出 SPSS 对 未 分 类 观测 进行 的 分 类 ， 分 类 被 保存 在 “Dis 1” 变 量 中 ，“1” 表 示 
违约 ，“0” 表 示 履 约 ， 这 与 我 们 在 建立 变量 时 的 设置 是 一 致 的 ， 如 图 12-16 所 示 。 


起 "Atisev [开间 委 1] -四 M 5p55 Stetistics 娄 尖 入 太吉 = 器 并 


aeEETELT 


图 12-16 对 未 分 类 观测 进行 的 分 组 


12.2 ”逐步 判别 分 析 
逐步 判别 分 析 是 在 分 析 之 前 对 自 变量 进行 一 次 相应 利 选 的 判别 分 析 方法 。 


12.2.1 逐步 判别 分 析 简 介 


逐步 判别 分 析 分 为 两 步 ,首先 根据 自 变量 和 因 变 量 的 相关 性 对 自 变量 进行 筛选 , 然后 使 用 
选 定 的 变量 进行 判别 分 析 。 逐步 判别 分 析 是 在 判别 分 析 的 基础 上 采用 有 进 有 出 的 办 法 , 把 判别 
能 力 强 的 变量 引入 判别 式 的 同时 , 将 判别 能 力 最 差 的 变量 剔除 。 最终 在 判别 式 中 只 保留 数量 不 
多 而 判别 能 力 强 的 变量 。 

12.2.2 逐步 判别 分 析 的 SPSS 操作 

打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 

中 进行 逐步 判别 分 析 。 
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1) 在 菜单 栏 中 选择 “分 析 ”|“ 分 类 ”|“ 判 别 式 ” 命 令 ， 打 开 如 图 12-17 所 示 的 “判别 分 
析 ” 对 话 框 。 

2) 选择 变量 。 从 源 变量 列表 框 中 选择 参与 判别 分 析 的 目标 变量 ， 然 后 单 击 国 按钮 将 选中 
的 变量 先入 “ 自 变 量 ” 列 表 框 中 ， 从 源 变量 列表 框 中 选择 分 类 变量 ， 然 后 单 击 国 按 钮 将 选中 的 
变量 选 入 “分 组 变量 ”列表 框 中 ， 并 选中 “使 用 步 进 法 ” 单 选 按钮 ， 以 使 用 逐步 判别 分 析 ， 如 
图 12-18 所 示 。 


Ld 


图 12-17 “判别 分 析 ” 对 话 框 图 12-18 选择 使 用 逐步 判别 分 析 方法 
3) 进行 相应 的 设置 。 
定义 范围 
当 分 类 变量 选择 完毕 后 ，“ 定 义 范围 ”按钮 被 激活 。 单 击 该 按钮 ， 弹 出 “判别 分 析 : 定义 
范围 ”对 话 框 ,该 对 话 框 的 用 途 与 设置 方法 与 一 般 判 别 分 析 相 同 ,读者 可 以 参考 12.1.2 节 , 在 
此 不 再 殉 述 。 


入 1: 纱 法 基 
“统计 ”设置 | [i 
单 击 “ 统 计 ” 按 钮 ， 弹 出 “判别 分 析 : 统计 ” | 923 be Ee Jere 
对 话 框 , 该 对 话 框 的 用 途 与 设置 方法 与 一 般 判别 分 | 2 有 De 
析 相 同 ， 读 者 可 以 参考 12.1.2 节 ， 在 此 不 再 歼 述 。 到 
“方法 ”设置 Bm i | 
单 击 “方法 ”按钮 , 弹出 如 图 12-19 所 示 的 “ 判 国 辐 加 时 全 二 


别 分 析 ， 步 进 法 ”对 话 框 。 - - ee 
@ “方法 ”选项 组 。 该 选项 用 于 设置 进行 判 。 ”图 1219 “判别 分 析 : 步 进 法 ”对 话 框 
别 分 析 时 对 变量 分 类 所 使 用 的 方法 。 


威 尔 克 Lambda: 表示 输入 使 总 体 的 威 尔 克 lambda 统计 量 最 小 的 变量 。 
未 解释 方差 : 表示 输入 使 组 间 未 解释 变动 的 总 和 最 小 的 变量 。 

马 氏 距离 : 表示 输入 使 最 靠近 的 两 类 间 的 马 氏 距离 最 大 的 变量 。 

最 小 下 比 : 表示 输入 能 使 任何 两 类 间 的 最 小 下 值 最 大 的 变量 。 

拉 奥 V: 表示 输入 使 拉 奥 V 增加 最 大 的 变量 。 


@@ “条 件 ” 选 项 组 。 该 选项 组 用 于 设置 保留 或 剔除 变量 的 准则 。 
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。 使 用 F 值 : 选中 该 单 选 按 钮 ， 系统 将 使 用 下 值 作为 保留 或 剔除 变量 的 标准 。 当 下 值 大 于 进 
入 值 时 , 变量 就 会 进入 模型 ， 当 下 值 小 于 删除 值 时 , 该 变量 就 会 被 删除 , 用 户 可 以 通过 “ 进 
入 ”和 “除去 ”文本 框 设 置 相 应 的 标准 。 
。 使 用 下 的 概率 : 选中 该 单 选 按钮 系统 将 使 用 下 值 的 概率 作为 保留 或 除去 变量 的 标准 。 
@@ “输出 ”显示 组 。 该 选项 组 用 于 设置 显示 内 容 。 选 中 “步骤 摘要 ” 复 选 框 ， 系 统 将 输 
出 逐步 判别 中 每 一 步 的 相应 统计 量 ; 选中 “成 对 距离 的 F” 复 选 框 ， 系 统 将 输出 每 两 类 别 间 的 
F 比率 矩阵 。 
“分 类 ”设置 
单 击 “ 分 类 ”按钮 ， 弹 出 “判别 分 析 : 分 类 ”对 话 框 ， 该 对 话 框 的 用 途 与 设置 方法 与 一 般 
判别 分 析 相 同 ， 读 者 可 以 参考 12.1.2 节 ， 在 此 不 再 效 述 。 
“保存 ”设置 
单 击 “ 保 存 ” 按 钮 ， 弹 出 “判别 分 析 : 保存 ”对 话 框 ， 该 对 话 框 的 用 途 与 设置 方法 与 一 般 
判别 分 析 相 同 ， 读 者 可 以 参考 12.1.2 节 ， 在 此 不 再 资 述 。 
4) 分 析 结果 输出 。 
设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 结果 窗口 得 到 逐步 判别 分 析 的 结果 。 


12.2.3 ”实验 操作 
下 面 将 以 数据 文件 “12-2” 为 例 ， 讲 解 逐 步 判 别 分 析 的 具体 操作 过 程 并 对 输出 结果 进行 说 明 。 
1. 实验 数据 描述 


数据 文件 “12-2” 来 源 于 北京 大 学 出 版 社 出 版 的 《应 用 多 元 统计 分 析 》《〈 高 惠 琉 ，2005 ) ， 
该 数据 文件 记录 了 21 家 上 市 公司 的 财务 数据 , 这 21 家 公司 被 分 为 投资 价值 高 、 投 资 价值 中 等 
和 投资 价值 低 三 类 , 本 实验 将 利用 逐步 判别 分 析 方法 对 公司 的 投资 价值 进行 分 析 。 本 数据 文件 
的 原始 Excel 数据 如 图 12-20 所 示 。 


下 B [3 D E BR 6 于 了 
| 履 持 简称 每 收 收 益 《 元 ) 性 资产 收益 率 主 营 业务 收入 增长 率 祝 后 币 中 增长 率 流动 比率 速 动 比率 应 收 账 款 周 转 率 “类别 

种 2.37 0.22| 0.36 2 1.44 104. 86 投 慰 投资 价值 高 

2 0.59 152. 49 除权 投资 价值 高 

1.2| 2277. 27 投票 投资 价值 高 


2 


EE 


四 四 E39E 


员 员 民品 吕 加 训 居 品 可 BE 


Eads a ss 


12-20 ”数据 文件 “12-2” 原 始 数 据 
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首先 在 SPSS 变量 视图 中 建立 变量 “股票 简称 ”“ 每 股 收益 ”“ 净 资产 收益 率 ”“ 主 营业 
务 收 入 增长 率 ”“ 税 后 利润 增 长 率 ”“ 流 动 比率 ”“ 速 动 比率 ”“ 应 收 账 款 周转 率 ” 和 “类 别 ”， 
分 别 用 来 表示 公司 及 其 财务 状况 和 投资 价值 分 类 ， 如 图 12-21 所 示 。 其 中 , “类 别 ” 变 量 中 使 
用 数值 “1、2、3” 分 别 表示 “股票 投资 价值 高 “股票 投资 价值 中 等 ”和 “股票 投资 价值 低 ”。 


全 “到 上 RF sav [区 里 生 1] - 内 M SPSS Statistics 要 宣 二 要 三 ”和 


“ 志 “ 主 量 业务 收入 坦 长 
5 机 后 利 河 直 攻 和 


二 加 国 本 
二 当 
伟 计 
攻 ”“ 攻 
必 ” 攻 
无 无 
-3 
无 无 
{ 无 


图 12-21 数据 文件 “12-2” 的 变量 视图 


然后 在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 
部 分 数据 如 图 12-22 所 示 。 


| 起 ,还 em219W av [下 吏 入 1 -BM SPSS Statistics 烧 开 扣 汉 中 二 


| 
1 
EE 
吧 
8 
39 
6 
a 
4 
3 
万 
08 
02 
40 
2 
79 


图 12-22 数据 文件 “12-2” 的 数据 视图 
2. 实验 操作 步骤 
实验 的 具体 操作 步骤 如 下 : 
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GES6i 在 菜单 栏 中 选择 “分 析 ”|“ 分 类 ”|“ 判 别 ”命令 ， 打 开 “ 判 别 分 析 ” 对 话 框 。 

人 GE362 从 源 变量 列表 框 中 选择 “每 股 收益 7”“ 净 资产 收益 率 ”“ 主 营业 务 收 入 增长 率 ”“ 税 后 
利润 增长 率 ”“ 流 动 比率 ”“ 速 动 比率 ”和 “应 收 账 款 周转 率 ” 变 量 ， 单 击 国 按 钮 将 
它们 选 入 “ 自 变量 ”列表 框 中 ; 从 源 变量 列表 框 中 选择 “类 别 ”变量 , 将 其 选 入 “分 
组 变量 ”列表 框 中 。 

本 303 选中 “使 用 步 进 法 ” 单 选 按钮 。 

GE563 单 击 “ 定 义 范围 ”按钮 ， 在 “判别 分 析 : 定义 范围 ”对 话 框 中 输入 类 别 变量 的 取 值 
范围 1-3， 单 击 “继续 ”按钮 。 

GES365 单 击 “保存 ”按钮 ， 在 “判别 分 析 : 保存 ”对 话 框 中 选中 “预测 组 成 员 ” 复 选 框 ， 

单 击 “ 继 续 ” 按 钮 。 

(GE366 单 击 “确定 ”按钮 ， 便 可 以 得 到 逐步 判别 分 析 的 结果 。 

3. 实验 结果 及 分 析 

SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 12-23~ 图 12-29 所 示 。 


图 12-23 给 出 了 样本 数量 、 有 效 值 和 排除 值 组 统计 
的 相关 信息 。 区 ph 


图 12-24 给 出 了 各 组 和 所 有 观测 的 均值 、 标 RN 。 Rk 司 


8.000 
8.000 
8.000 
8000 
8.000 
8000 
8.000 


准 差 和 加 权 与 未 加 权 的 有 效 值 。 澡 栅 产 收 庆 率 一 


8 
8 
让 兽 业 务 权 入 增长 
ETTTIS 8 
扰动 比率 8 
束 盈 比率 8 
应 收 几 款 网 斩 率 8 
股 时 投 人 价值 中 委 每 股 收 藏 9 9000 
六 页 产 收益 9 9000 
9 9000 
ETTE 9 9000 
9 9000 
9 9.000 
9 9000 
4 4000 
4 4000 
4 
4 
4 
4 


股票 投资 价 信 低 每 验收 益 


4000 
4000 
分 析 个 案 处 理 摘要 
未 加 权 个 案 数 个 来 数 。 百分比 _ 速 动 比率 4000 
有 效 21 1000 应 履 账 款 周转 束 4 4000 
排除 。 缺失 或 超出 范围 组 代码 0 0 总 计 每 股 收益 21 21.000 
下 少 一 个 揣 失 肇 别 变 明 0 0 净 届 产 收益 幸 21 “21000 

医 公 括 缺 失 或 加 出 范围 组 0 0 主 殖 业务 收入 增长 丰 21 21000_ 
代码 ， 也 包括 至 少 一 个 缺 税 后 利润 者 长 素 21 21000 
失 章 别 交 重 lL 流动 比率 21 21000 
总 计 0 0 束 动 比率 21 21000 
总 计 21 1000 应 收 星 款 周转 率 21 21000 


图 12-23 个 案 综合 处 理 摘要 12-24 组 统计 量 


图 12-25 给 出 了 变量 的 筛选 过 程 。 由 图 中 我 们 可 以 看 出 ， 加 入 了 净 资 产 收 益 率 变量 ， 威 尔 
克 Lambda 统计 量 很 显著 ， 说 明 增 加 的 变量 对 于 分 类 具有 显著 的 作用 。 


税 后 利 洞 二 长 替 
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输入 /除去 的 变量 abcd 
威 尔 克 Lambda 
精确 F 
步骤 多 入 统计 。 自由 度 1 | 自由 度 2 。 自由 度 3 ”统计 。 | 自由 度 1 | 自由 度 2 | 呈 千 性 
1 效 讼 产 收益 率 597 1 2 18000 6067 2 18.000 010 
在 每 个 步 召 中 ， 将 输入 可 以 使 总 体 戌 尔 克 Lambda 最 小 化 的 交 莹 
a 最 大 步 台数 为 14。 
b. 要 移入 的 最 小 售 F 为 384.。 
5. 要 除去 的 最 大 偏 F 为 2.71。 
d.F 级 别 、 害 短 或 VIN 不 足 ， 无 法 进行 进一步 计算 。 
包括 在 分 析 中 的 变量 
步 骏 容 差 要 除去 的 F 
1 净 资 产 收益 替 1.000 6.067 
未 包括 在 分 析 中 的 变量 
威 尔 克 
步 如 容 逢 最 小 容 闲 ”要 多 入 的 F Lambda 
0 信服 收藏 1000 1.000 5.515 620 
兆 磺 产 收 基 素 1000 1000 6067 597 
去 背 亚 务 收 天 需 长 有 1000 1.000 958 904 
税 后 利 洒 坦 长 束 1000 1000 2.846 760 
流动 比率 1.000 1.000 2.213 803 
填 动 比率 1000 1.000 2278 798 
_ 应 收 袜 款 周转 来 1000 1.000 1222 880 
1 873 873 2022 483 
860 .860 012 597 
94 941 3168 435 
镜 动 比率 899 899 1.181 524 
连 动 比 素 810 810 2.392 466 
到 术 限 饮 网 竺 击 ”1.000 1.000 925 539 
威 尔 克 Lambda 
靖 确 F 
消 曼 变 重 数 Lambda 向 由 应 1 身 由 度 2 自由 度 3 统计 自由 度 1 自由 度 2 显著 性 
a 1 597 1 2 18 6.067 2 18.000 .010 


图 12-25 ”变量 的 筛选 过 程 
由 图 12-26 可 以 看 出 判别 函数 解释 了 所 有 变异 的 59.7%， 且 在 统计 上 是 显著 的 ， 具有 判别 


特征 值 
特征 值 | 方 拓 百分比 | 累计 百分比 | 典型 相关 性 
674? 1000 1000 635 


作用 。 
威 尔 克 Lambda 
威 尔 克 疗 数 
局 数 检 验 Lambda 卡 方 自由 度 显著 性 1 
4 .597 9.275 2 010 


a. 在 分 析 中 使 用 了 前 1 个 类 则 判 则 函数 。 


图 12-26 ”判别 函数 的 检验 
12-27 给 出 了 判别 函数 的 系数 与 结构 和 矩阵, 我们 可 以 看 出 ， 只 有 净 资 产 收 益 率 变量 在 判 


别 分 析 中 使 用 。 
图 12-28 给 出 了 组 质心 处 的 判别 函数 值 。 


图 12-29 给 出 了 组 的 分 类 处 理 摘要 和 三 个 组 的 加 权 与 未 加 权 的 先 验 概率 。 
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结构 矩阵 
函数 
1 
- 痊 要 产 收 闪 率 1000 
加 动 比率 a 436 
主 营业 务 收入 增长 素 * .375 组 质心 处 的 函数 
每 股 收 藏 > 356 
访 动 比率 319 全 站 
后 利 间 浊 攻 素 ” 。。。 类 则 1 
标准 化 典 则 判别 函 税 后 利 油 塌 长 率 ” -244 全 
数 系数 训 收 康 区 周转 可 = 003 股票 投资 价值 高 .672 
刘 别 变量 与 标准 化 类 则 判别 员 数 之 股票 投资 价值 中 等 .051 
六 数 则 的 汇 栗 组 内 相关 性 i 
1 变量 按 兄 数 内 相关 性 的 绝对 大 小 一 卫 票 搜 资 价值 低 -1.458 _ 
Es 按 组 平均 值 进行 求 值 的 未 标准 
Bi 1.00_ a .在 分 折 中 未 使 用 此 变量 。 化 类 则 判别 计数 
12-27 判别 函数 系数 与 结构 矩阵 12-28 组 质心 处 函数 值 
组 的 先 验 概率 
在 分 析 中 使 用 的 个 案 
分 类 处 理 摘要 类 别 先 验 末 加 权 加 权 
已 处 理 21 股票 投资 价值 高 .333 8 8.000 
排除 缺失 或 超出 范围 组 代码 0 股票 投资 价值 中 等 333 _ 9 9000 
至 少 一 个 缺失 判别 变 全- 0 股票 投资 价值 低 .333 4 4.000 
已 在 输出 中 使 用 21 总 计 1.000 21 21.000 


12-29 组 的 分 类 处 理 摘要 与 先 验 概率 


同时 , 预测 的 分 组 结果 作为 新 的 变量 被 保存 , 我 们 可 以 看 出 判别 分 析 的 分 组 的 归 类 准确 程 
度 ， 分 类 被 保存 在 “Dis_1” 变 量 中 ， 如 图 12-30 所 示 。“1” 表 示 “ 投 资 价值 高 ”“2” 表 示 
“投资 价值 中 等 ”“3” 表 示 “ 投 资 价值 低 ”， 这 与 我 们 在 建立 变量 时 的 设置 是 一 致 的 。 


起, 证 步 章 8 全 Wi.sav [ 数 各 入 1] - IBM SPSS Statistics 数据 涡 各 器 = 
文件 (E) 坊 可 (E) 下 看 QI。 执 据 但) 转 搜 D 分 怕 邮 | 下岗 WY(G) 实用 程序 LW) 扩展 o0) 盏 口才 助 时 ) 


+1.Dis_1 lto0 本 机: 10110 个 去 时 


服 每 有 3 主 营 二 务 由 gp 税 后 利 闻 gp 流动 | gp 如 动 /p 应 收 丸 凌 哺 关 别 
dr rd 

ED] 237 2 31 3 20% 14 1%86 10 
2 双汇 发 展 72 21 3 2 1 59 15249 100 
EELL3 29 1f 2 -M4 18 120 227727 100 
丰厚 生化 人 4 06 48 37 52 30 1493 100 
二 | 伊利 股份 75 3 39 3 109 78 8023 100 
BLESS 2 06 16 0 46 7577 100 
| 也] 池 放 老 守 上 吧 1 2 161 氏 363 100 
CE 也 06 1 吕 126 多 4129 100 
号 | 南方 贸 直 3 ™ -03 -1 “ 驹 4 854 200 
10 示 化 和 区 of 00 五 -101 388 258 0 “200 
EL [7 0 -0 “72 7 107 34 200 
2 | 里 台 殿 份 03 0 02 -45 114 63 212 200 
要 | 荐 花 味精 0 of 40 1 12 113 186 20 
二 | 维 维 隘 份 人 4 06 29 0 132 106 1323 200 
便 | 能 特 生物 2 98 79 ‘52 236 221 466 200 


TEN SPSS Statistics 处 于 程序 流 霹 | |UnicodeON | | 


图 12-30 ”对 观测 进行 的 分 组 
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决策 树 分 析 因 其 输出 结果 采用 树 型 结构 图 而 得 名 ,决策 树 分 析 在 分 析 群 体 之 间 的 相关 关系 
和 预测 方面 具有 广泛 的 应 用 。 


12.3.1 决策 树 分 析 简 介 


决策 树 分 析 将 每 个 样本 集中 的 每 个 观测 都 看 成 n 维 空间 上 的 一 个 点 ,决策 树 每 一 个 分 枝 的 
形成 过 程 ， 就 是 对 n 维 空间 的 一 次 区 域 划分 ， 当 决策 树 建立 后 ，n 维 空间 便 被 划分 为 了 若干 区 
域 ,区域 划分 结果 采用 树 型 结构 图 表示 。 我们 可 以 把 决策 树 应 用 到 一 个 全 新 的 资料 集合 上 , 并 
观察 其 分 类 正确 的 比率 ， 来 衡量 这 个 决策 树 的 有 效 程度 。 


12.3.2 ”决策 树 分 析 的 SPSS 操作 


对 于 数据 文件 “12-1”, 我 们 也 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 进行 决策 树 分 析 ， 
分 析 对 违约 行为 最 重要 的 影响 因素 。 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 分 类 ”|“ 决 策 树 ”命令 ， 在 弹出 “决策 树 ” 对 话 框 前 ， 系 
统 将 弹出 一 个 提示 对 话 框 ， 如 图 12-31 所 示 。 

该 信息 提示 用 户 在 进行 决策 树 分 析 前 ， 必 
须 为 相应 的 变量 设置 正确 的 测量 水 平 并 为 分 类 
变量 设置 相应 的 值 标签 。 单 击 “ 确 定 ”按钮 ， 
进入 如 图 12-32 所 示 的 “决策 树 ” 对 话 框 ， 对 
树 模型 进行 定义 。 


砚 是 否 曾 经 击 的 沁 约 ] 国 


x 


ne Re i 因 汉 所 第 一 个 到 号 
全 是 分 类 实 重 ， 那 么 应 计 为 每 个 交 人 定义 全 标 六。 NN); 
ee 在 二 某 个 J 
按 罕 义 安 生 志 人 "可以 为 本 区 设 轩 利 重 控 全 哄 定义 标 痊 。 到 量 ' 以 E 改 关 到 国 可 别 [re | 
日 Ati 权 
| [LE ] 7 Ee@) [ea aa 
图 12-31 变量 格式 设 定 的 提示 信息 图 12-32 “决策 树 ” 对 话 框 


2) 选择 变量 。 

从 源 变量 列表 框 中 选择 决策 树 分 析 的 因 变量 ， 单 击 国 按 钮 选 入 “ 因 变 量 ” 列 表 框 中 ， 从 
源 变 量 列表 框 中 选择 决策 树 分 析 自 变量 ， 单 击 国 按 钮 选 入 “ 自 变量 ”列表 框 中 。 在 此 可 以 选 
中 “强制 第 一 个 变量 ” 复 选 框 系统 将 自动 把 自 变 量 列表 中 的 第 一 个 变量 作为 决策 树 的 开始 节 
点 。 选 择 影响 变量 ,将 其 先入 “影响 变量 ”列表 框 中 ,影响 变量 用 于 衡量 单个 观测 对 决策 树 生 
长 的 影响 程度 , 该 变量 取 值 越 大 的 观测 对 决策 树 的 生长 影响 越 大 .变量 的 选择 如 图 12-33 所 示 。 

3) 设置 相应 的 选项 。 
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“类 别 ” 按 钮 

单 击 “ 类 别 ” 按 钮 ， 弹 出 如 图 12-34 所 示 的 “决策 树 : 类 别 ” 对 话 框 。 
具 六 某 而 

0D: 
在 玄 量 列表 中 右键 单 击 革 个 
到 量 ， 以 天生 名册 使 用 这 些 复 先 框 可 以 选择 主要 对 其 古 兴 和 的 一 个 《长 多 个 ) 类 别 。 例 吉 ， 如 果 您 尖 试 标识 很 可 能 对 邮 - 

件 抽 出 响应 的 人 员 的 特征 , 那么 了 应 "将 为 目标 类 别 。 
[LE ] He ERG LN | | 
图 12-33 ”决策 树 分 析 的 变量 选择 12-34 “决策 树 :， 类 别 ” 对 话 框 


“类 别 ” 列 中 给 出 了 因 变 量 的 值 标签 , “ 目 
标 ” 列 给 出 了 对 应 类 别 列 的 复 选 框 , 用 户 可 以 根 
据 研究 需要 选择 相应 的 类 别 取 值 ; “排除 ”列表 
框 用 于 选 入 不 参与 分 析 的 因 变 量 取 值 。 


轩 从 上 理 下 D) 


“生长 法 ”下 拉 列 表 框 A 
该 下 拉 列 表 框 用 于 选择 决策 树 的 生长 方法 ， Es 
日 志和 图 标 (A) 


有 “CHAID”“ 穷 举 CHAID”“CRT” 和 “QUEST” 
4 种 方法 供用 户 选择 。 

“输出 ”设置 

单 击 “ 输 出 ”按钮 ， 弹 出 如 图 12-35 所 示 的 
“决策 树 : 输出” 对话 框 。 


该 对 话 框 用 于 进行 决策 树 的 输出 设置 , 分 为 
“ 树 ”“ 统 计 ” 和 “规则 ”3 个 选项 卡 。 图 12-35 “决策 树 : 输出 ”对 话 框 


@ “ 树 ” 选 项 卡 。 该 选项 卡 用 于 设置 树 的 输出 。 
。 “ 树 ” 复 选 框 : 选中 该 复 选 框 ， 表 示 输 出 决策 树 ， 并 激活 “输出 ”选项 组 。 用 户 可 以 在 “ 输 


出 ”选项 组 中 设置 决策 树 的 方向 、 节 点 、 刻 度 等 相关 选项 。 
。 “使 用 表格 式 的 树 ” 复 选 框 :选中 该 复 选 框 ， 表 示 以 表格 形式 输出 决策 树 。 


@ “统计 ”选项 卡 。“ 统 计 ” 选 项 卡 如 图 12-36 所 示 。 


。 “模型 ”选项 组 : 该 选项 组 用 于 设置 关于 模型 的 输出 信息 。 如 选中 “摘要 ” 复 选 框 ， 系 统 
将 输出 模型 的 统计 摘要 信息 ; 选中 “风险 ” 复 选 框 ， 系 统 将 输出 模型 的 风险 估算 及 其 标准 
误 ; 选中 “分 类 表 ” 复 选 框 ， 对 于 分 类 变量 ， 系 统 将 输出 在 其 每 个 取 值 上 的 正确 判定 与 错 


标 度 : 图 自动 《 减 小 大 型 树 的 祭 度 ) (Q) 
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误 数 ; 选中 “成 本 、 先 验 概率 、 得 分 和 利润 值 ” 复 选 框 ， 对 于 分 类 变量 系统 将 输出 错 判 损 
失 函 数 、 得 益 函 数 、 得 分 和 先 验 概率 。 

。 “ 自 变量 ”选项 组 : 该 选项 组 用 于 设置 自 变量 的 相关 参数 。 选 中 “对 模型 的 重要 性 ” 复 选 
框 ， 系 统 将 会 把 模型 中 的 自 变量 按 其 重要 性 进行 排序 ， 此 复 选 框 只 有 在 选择 CRT 方法 下 
才 会 被 激活 ; 选中 “替代 变量 ” 复 选 框 ， 系 统 将 列 出 所 有 可 能 的 方案 ， 此 复 选 框 只 有 在 选 
择 CRT 和 QUEST 方法 时 才 会 被 激活 。 

e “节点 性 能 ”选项 组 : 该 选项 组 用 于 设置 决策 树 节点 的 相关 输出 选项 。 选 中 “摘要 ” 复 选 
框 ， 系 统 将 输出 节点 的 摘要 表 ， 如 果 因 变量 是 分 类 变量 而 又 未 定义 得 益 ， 该 复 选 框 将 不 会 
被 激活 ; 选中 “ 按 目 标 类 别 ” 复 选 框 ， 对 于 定义 了 目标 取 值 的 分 类 因 变 量 ， 系 统 将 输出 得 
益 比 例 、 响 应 比例 和 lift 值 等 信息 。 此 外 ， 用 户 还 可 以 利用 “ 行 ”“ 排 序 顺序 ”和 “ 百 分 
位 数 增 量 ”下 拉 列 表 框 设置 节点 信息 表 的 输出 方式 并 可 选中 “显示 累积 统计 信息 ” 复 选 框 
以 输出 累积 结果 。 


@ “规则 ”选项 上 不。“ 规 则 ”选项 卡 如 图 12-37 所 示 。 


Ls 出 
个 型 「 节点 性 能 
导 摘要 GS) {su 
MW RE) 国术 Bf 


园 分 类 表 (G) 
思 成 本 、 先 痊 概 率 、 得 分 和 利 亲 值 O) 


图 12-36 “统计 ”选项 卡 图 12-37 “规则 ”选项 卡 


。 “生成 分 类 规则 ” 复 选 框 : 选中 该 复 选 框 ， 表 示 输 出 分 类 决策 规则 ， 并 激活 “语法 ”“ 类 
型 ”和 “节点 ”选项 组 。 

。 “语法 ”选项 组 : 该 选项 组 用 于 设置 分 类 规则 的 语法 形式 ， 用 户 可 以 选择 SPSS Statistics、 
SQL 和 简单 文本 3 种 语法 形式 。 

。 “类 型 ”选项 组 。 该 选项 组 用 于 设置 SPSS 命令 语句 和 SQL 语句 的 决策 规则 的 类 型 。 选 中 
“为 个 案 指定 值 ” 单 选 按钮 ， 系 统 将 为 满足 节点 成 员 条 件 的 每 个 节点 单独 生成 规则 ; 选中 
“选择 个 案 ” 单 选 按钮 ， 系 统 将 生成 用 于 选择 满足 条 件 的 个 案 的 单个 规则 ; 选中 “将 替代 
变量 包含 在 SPSS Statistics 和 SQL 规则 中 ” 复 选 框 ， 系 统 将 输出 所 有 可 能 的 方案 的 决策 规 
则 ， 该 复 选 框 只 有 在 选择 CRT 和 QUEST 方法 时 才 会 被 激活 。 

。 “节点 ”选项 组 : 该 选项 组 用 于 为 每 个 选择 的 节点 生成 单独 的 规则 ， 用 户 可 以 把 所 有 终端 
节点 、 最 佳 终端 节 点 、 达 到 指定 个 案 百 分 比 的 最 佳 终端 节点 、 索 引 值 满足 或 超过 分 界 值 的 
终端 节点 或 所 有 节点 作为 生成 规则 的 相应 节点 范围 。 
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行 验证 。 


示 进 行 交 叉 验 证 。 系 统 先 将 样本 分 解 为 多 个 子 样本 ， 对 
于 一 个 子 样本 系统 用 不 包含 它 的 其 他 子 样本 建立 决策 
树 并 通过 计算 对 该 子 样本 的 错 判 率 来 检验 分 类 效果 , 用 
户 可 以 在 “样本 群 数 ”文本 框 中 输入 子 样本 的 群 数 。 


“验证 ”按钮 
单 击 “ 验 证 ”按钮 ， 弹 出 如 图 12-38 所 示 的 “决策 
树 : 验证 ”对 话 框 。 


© 


© 


“无 ” 单 选 按钮 。 选 中 该 单 选 按钮 ， 表 示 不 进 


“交叉 验证 ” 单 选 按钮 。 选 中 该 单 选 按钮 ， 表 


@ “分 制 样本 验证 ” 单 选 按钮 。 选 中 该 单 选 按钮 ， 六 
表示 进行 样本 分 离 验 证 , 同时 将 激活 “个 案 分 配 ” 和 “ 显 mm 
示 以 下 项 的 结果 ”选项 组 。 12-38 “决策 树 ， 验 证 ”对 话 框 


“个 案 分 配 ” 选 项 组 :进行 样本 分 离 验 证 时 ， 系 统 将 样本 划分 为 训练 样本 和 验证 样本 。 训 
练 样本 用 于 生成 决策 树 ， 验 证 样本 用 于 验证 模型 。 该 选项 组 用 于 设置 训练 样本 和 验证 样本 
的 划分 方式 。 选 中 “使 用 随机 分 配 ” 单 选 按钮 ， 系 统 将 随机 分 配 样本 ， 用 户 可 以 通过 其 下 
的 文本 框 确定 两 种 样本 的 比例 ; 选中 “使 用 变量 ” 单 选 按钮 ， 表 示 通 过 指定 变量 来 划分 样 
本 ， 用 户 可 以 选择 作为 划分 依据 的 变量 ， 从 “变量 ”列表 框 中 单 击 国 | 按钮 将 其 选 入 “样本 
拆 分 依据 ”列表 框 中 。 

“显示 以 下 项 的 结果 ”选项 组 : 该 选项 组 用 于 设置 输出 分 析 结果 的 样本 范围 。 选 中 “训练 
和 检验 样本 ” 单 选 按钮 ， 系 统 对 训练 样本 和 验证 样本 都 输出 相关 的 结果 ; 选中 “ 仅 检验 样 
本 ” 单 选 按钮 ， 系 统 将 只 输出 验证 样本 的 相关 结果 。 


CHAID 算法 的 “条 件 ” 按 钮 


在 “生长 法 ”下 拉 列 表 框 中 选择 CHAID 
算法 , 然后 单 击 “ 条 件 ” 按 钮 , 弹出 如 图 12-39 


© 


所 示 的 “决策 树 : 标准 ”对 话 框 。 TB [全 rs 扫 
“增长 限制 ” 选项 卡 一 
“最 大 树 深度 ”选项 组 : 该 选项 组 用 | “2 
于 设置 决策 树 在 根 节点 以 下 的 最 大 树 
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深度 。 选 中“ 自动” 单 选 按钮 ， 系 统 
采用 默认 最 大 树 深度 ; 选中 “定制 ” 
单 选 按钮 ， 系 统 使 用 用 户 自 定义 树 深 
度 ， 用 户 可 以 在 “ 值 ”文本 框 中 输入 
自 定义 树 深度 。 12-39 “决策 树 : 标准 ”对 话 框 
“最 小 个 案 数 ”选项 组 : 该 选项 组 用 于 设置 每 个 节点 所 需要 的 最 小 观测 数 , 用 户 可 以 在 “ 父 
节点 ”和 “ 子 节点 ”文本 框 中 指定 父 节 点 和 子 节点 所 需要 的 最 小 观测 数 。 
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@ CHAID 选项 卡 。CHAID 选项 卡 如 图 12-40 所 示 。 


。 “以 下 项 的 显著 性 水 平 ”选项 组 : 该 选项 组 用 于 设置 折 分 与 合并 节点 的 显著 性 水 平 ， 用 户 
可 以 在 这 两 个 文本 框 中 输入 自 定 义 显著 性 水 平 。 

。 “模型 估算 ”选项 组 : 该 选项 组 用 于 设置 模型 估算 的 相关 方法 。 
> “最 大 迭代 次 数 ”文本 框 用 于 设置 最 大 和 迭代 次 数 ; 
> “期 望 的 单元 格 频率 中 的 最 小 更 改 ”文本 框 用 于 设置 单元 格 频率 的 最 小 改变 量 ， 用 户 

可 以 在 此 输入 自 定义 数值 。 

。 “ 卡 方 统计 ”选项 组 : 该 选项 组 用 于 设置 模型 估算 时 使 用 的 卡 方 统计 量 。 系 统 提供 了 两 种 
统计 量 : “皮尔 撑 ” 卡 方 统计 量 ， 一 般 用 于 大 样本 条 件 下 ; “ 似 然 比 ” 卡 方 统计 量 ， 一 般 
用 于 小 样本 条 件 下 。 

。 “使 用 Bonferroni 方法 调整 显著 性 值 ” 复 选 框 : 选中 该 复 选 框 ， 表 示 使 用 Bonferroni 方法 
调整 与 合并 节点 的 显著 性 水 平 。 

。 “人 允许 重新 拆 分 节点 中 合并 后 的 类 别 ” 复 选 框 : 选中 该 复 选 框 ， 表 示人 允许 系统 对 合并 的 节 
点 重新 拆 分 以 生成 更 好 的 决策 树 。 


@ “区 间 ” 选 项 卡 。“ 区 间 ” 选 项 卡 如 图 12-41 所 示 。 


Dn 宗 丰 起 > 1 


JEEE 因 E 


以 下 的 四 着 性 水 下 「 引 到 自 Z 旱 9 区 间 
拆 分 节点 (G): 。 |0.05 
各 并 次 BIN):。 [005 


概 型 个 下 
Bonterront 
最 大 选 代 闪 数 09): Feo] 加 和 方法 调整 异 若 性 入 (A) 
花 许 重新 拆 分 节点 中 合并 后 99 类 中 (W) 
期 好 的 单元 格 频率 中 的 最 ”|0 001 
小 于 区 中 ): 


图 12-40 CHAID 选项 卡 图 12-41 “区 间 ” 选 项 卡 


在 CHAID 决策 树 分 析 中 ， 对 于 连续 自 变量 ， 在 分 析 之 前 要 将 其 划分 入 离散 组 。“ 刻 度 自 
变量 的 区 间 ” 选 项 组 即 用 于 设置 初始 离散 组 的 个 数 。 用 户 可 以 选中 “固定 数目 ” 单 选 按钮 ， 为 
所 有 连续 自 变量 都 划分 相同 的 离散 组 ; 也 可 以 选中 “定制 ” 单 选 按钮 ， 为 各 个 连续 自 变量 指定 
不 同 的 分 组 。 

CRT 算法 的 “条 件 ” 按 钮 

在 “生长 法 ”下 拉 列 表 框 中 选择 CRT 算法 ， 然 后 单 击 “ 条 件 ” 按 钮 ， 弹 出 如 图 12-42 所 
示 的 “决策 树 : 标准 ”对 话 框 。 

@ “增长 限制 ”选项 卡 。 该 选项 卡 的 内 容 和 设置 方式 与 CHAID 方法 相同 ， 在 此 不 再 歼 
述 ， 读 者 可 自行 参考 相关 部 分 。 

@ “CRT” 选 项 卡 。CRT 选项 卡 如 图 12-43 所 示 。 
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CRT 生长 法 的 基本 原理 是 最 大 化 节点 内 部 各 观测 之 间 的 相似 性 ， 节 点 内 各 观测 之 间 的 差 
异 程度 以 杂质 衡量 。 


内 块 mpl: 标 信 


[TEC 


最 大 材 盏 储 一 | 「 县 小 个 江 对 名所 到 量 一 一 一 一 ee 
Samy se， 四 和 ] 
对 于 CHNID， 最 大 如 别 数 为 3; 对 于 CRT 和 OUEST, 此 如 别 抱 发 现 了 桂子 节点 之 局 与 目标 当量 的 入 相关 的 同 后 性 最 大 ftB3 拆 分 、 
为 5 了 AH: 加 
口 定 BC) 口 两 人 汉中 
全 


的 明光 QM): 。 [0001 


较 大 的 个 于 生成 六 小村。 


[aojLaaJLam 
图 12-42 “决策 树 : 标准 ”对 话 框 


图 12-43 CRT 选项 卡 
“杂质 测量 ”选项 组 用 于 设置 杂质 衡量 的 方法 ， 以 判断 该 节点 是 否 需 要 进一步 分 割 。 系 
统 提供 了 3 种 测量 杂质 的 方法 : 

。 基尼 : 该 方法 基于 因 变量 的 各 个 取 值 节点 内 出 现 的 概率 的 平方 ; 

。 两 分 法 : 该 方法 将 因 变量 的 取 值 分 为 两 个 子 集 ， 寻 求 最 适合 分 隔 两 个 组 的 分 割 方案 ; 

e 顺序 两 分 法 : 该 方法 与 两 分 法 基本 类 似 ， 但 其 只 能 对 相 邻 类 别 进 行 分 组 ， 只 有 因 变 量 是 有 

序 变 量 时 ， 该 单 选 按钮 才 会 被 激活 。 

@@ “修剪 ”选项 卡 。“ 修 剪 ”选项 卡 如 图 12-44 所 示 。 

该 选项 卡 用 于 决策 树 的 修剪 设置 。 选 中 “修剪 树 以 避免 过 度 拟 合 ” 复 选 框 ,表示 在 决策 树 
生长 完成 后 ， 系 统 将 对 其 进行 修剪 以 防止 过 度 生长 。“ 风 险 中 最 大 差分 (标准 误差 ) ”文本 框 
用 于 设置 修剪 后 的 决策 树 与 风险 最 小 的 决策 树 风险 值 的 最 大 差额 ， 系 统 默 认 值 为 1。 如果 增 大 
此 值 ， 将 输出 更 简单 的 决策 树 ， 如 果 要 输出 风险 最 小 的 决策 树 ， 则 输入 0。 

@ “替代 变量 ”选项 卡 。“ 蔡 代 变 量 ” 选 项 卡 如 图 12-45 所 示 。 

该 选项 卡 用 于 设置 最 大 替代 变量 的 个 数 ， 选 中 “自动 ” 单 选 按钮 ， 蔡 代 变 量 的 个 数 比 自 变 
量 少 一 个 , 也 可 以 选中 “定制 2 单 选 按钮 并 在 “ 值 ” 文本 框 中 输入 自 定义 的 最 大 替代 变量 个 数 。 


起 wp: 可 


Xx | | @>zai: 5 在 x 


EC 


季 大 痊 代 区 量 才 一 
图 自动 ( 比 自 量 徐 直 一 ) CI 
中 的 医大 差分 ( 标 才 最 等] 全 下 ORohCk 
在 树 生长 其 和 大 玫 讼 后 ， 绰 朋 会 特此 人 匀 至 用 有 可 接 人 yPUS 值 9 胡 小 了 村 
请 在 内 了 中 答 入 介 于 已 修 机 9 树 和 具有 明 低 风 的 的 于 村 之 局 8 强大 可 接 要 天 分 。 
轨 生 成 比较 滞 间 93， 请 增 大 如 大 莒 分 。 要 计 择 具有 老 低 扣子 树 ， 请 锁 和 0， 


[ae Lon Liam) 
12-44 “修剪 ”选项 卡 


图 12-45 “替代 变量 ”选项 卡 
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QUEST 算法 的 “条 件 ”按钮 

在 “生长 法 ”下 拉 列 表 框 中 选择 QUEST 算法 ， 然 后 单 击 “ 条 件 ” 按 钮 ， 弹 出 如 图 12-46 
所 示 的 “决策 树 : 标准 ”对 话 框 。 

QUEST 选项 卡 如 图 12-47 所 示 ， 该 选项 卡 用 于 设置 拆 分 节点 的 显著 性 水 平 临界 值 ， 用 户 可 
以 在 “ 拆 分 节点 的 显著 性 水 平 ”文本 框 中 输入 自 定义 显著 性 水 平 。 


起 z 芝 现 : 标 在 x | 本 mi 5 x 
| 


最 大 情 寺 放 RM | 
国 自动 W | AP [oo | 


拆 分 节 上 3 归 首 性 水 平 ES | 05 


天 co， Ra 对 于 CRT 和 和 ouesr tb 


| 了 AH。 加 


0 自 开 时 不 二 用 于 匠 分 节点 ， 际 直 其 号 香 性 信 小 于 或 基 于 您 折 定 的 水 平 。 
击 


ge gE fe 
12-46 ”QUEST 算法 下 的 “决策 树 : 标准 ”对 话 框 12-47 QUEST 选项 卡 
其 他 选项 卡 的 内 容 和 设置 方式 与 CHAID | 再世 站 二 和 
方法 相同 ,在 此 不 再 奖 述 , 读者 可 自行 参考 相 。 =naa 
关 部 分 。 IE 
< 保存 ”设置 Ne 
单 击 “ 保 存 ” 按 钮 ， 弹 出 如 图 12-48 所 示 | [名 Ra 
的 “决策 树 : 保存 ”对 话 框 。 XE gs 
该 对 话 框 用 于 进行 决策 数 分 析 保 存 的 相 。 0 
大 匡 本 本 加 
@ “已 保存 的 变量 ”选项 组 。 选 中 “ 终 - 
端 节点 数 ” 复 选 框 ， 系 统 将 每 个 个 案 的 终端 节 图 12-48 “决策 树 : 保存” 对话 框 


点 数 作为 变量 保存 ; 选中 “预测 值 ” 复 选 框 , 系统 将 模型 所 预测 的 因 变 量 的 分 类 作为 变量 保存 ; 
选中 “预测 概率 ” 复 选 框 ， 系 统 会 将 模型 的 预测 关联 的 概率 作为 变量 保存 ， 选 中 “样本 分 配 ” 
复 选 框 ， 系统 将 训练 样本 和 验证 样本 的 划分 信息 作为 变量 保存 ,该 复 选 框 只 有 在 选中 “分 割 样 
本 验证 ” 单 选 按 钮 后 才 会 被 激活 。 

@ “将 树 模型 以 XML 格式 导出 ”选项 组 。 该 选项 用 于 设置 以 XML 格式 保存 决策 树 的 模 
型 ， 可 以 导出 两 种 XML 文件 。 


。 训练 样本 ， 选 中 该 复 选 框 ， 系 统 会 将 决策 树 模型 写 入 指定 的 XML 文件 ， 用 户 可 以 在 “ 文 
件 ” 文 本 框 中 指定 相应 的 文件 路 径 ， 对 于 分 割 样本 验证 的 决策 树 ， 系 统 将 输出 基于 训练 样 
本 的 决策 树 模型 ; 

。 检验 样本 ， 选 中 该 复 选 框 ， 系 统 会 将 基于 检验 样本 的 模型 写 入 指定 的 XML 文件 ， 该 复 选 
框 只 有 在 选择 “分 割 样本 验证 ” 单 选 按钮 后 才 会 被 激活 。 
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CHAID 算法 的 “选项 ”按钮 


在 “ 


生长 法 ”下 拉 列 表 框 中 选择 CHAID 算法 ， 


然后 单 击 “ 选 项 ” 按钮， 弹出 如 图 12-49 所 示 的 “ 决 
策 树 ; 选项” 对话 框 。 


© 


“错误 分 类 成 本 ”选项 卡 。 该 选项 卡 用 于 


设置 误 判 惩罚 函数 的 相关 参数 ， 选 中 “在 各 类 别 之 


间 相 等 ” 单 选 按钮 ， 表 示 对 各 种 分 类 误 判 的 惩罚 程 


检阅 : 运 项 
加 在 有 关 吕 之 局 从 等) 
日 证 gJG) 


度 相同 ; 选中 “定制 ” 单 选 按钮 , 用 户 则 可 以 在 “ 预 
测 类 别 ” 二 维 表 中 设置 自 定义 惩罚 措施 ， 只 有 因 变 
量 是 分 类 变量 且 设 定 了 值 标签 ， 该 单 选 按钮 才 会 被 
在 “填充 矩阵 ”选项 组 中 可 设置 使 惩罚 矩阵 成 为 对 称 矩 阵 的 方法 。 


。 复制 下 三 角形 : 


表示 将 候 阵 下 三 角形 中 的 值 复 所 
。 复制 上 三 角形 : 表示 将 矩阵 上 三 角形 中 的 值 复 负 
。 使 用 平均 单元 格 值 : 表示 使 用 两 对 称 单元 格 值 的 
@ “利润 ” 选项 卡 。 


[ae] ma | Rh 
“决策 树 : 选项 ”对 话 框 


12-49 


到 对 应 的 上 三 角形 单元 格 中 以 使 其 对 称 。 
到 对 应 的 下 三 角形 单元 格 中 以 使 其 对 称 。 
平均 值 蔡 换 这 两 个 值 。 


“利润 ”选项 卡 如 图 12-50 所 示 。 


该 选项 卡 用 于 设置 正确 判断 的 收益 函数 的 相关 参数 ， 同 样 有 两 个 单 选 按钮 : 选中 “无 ” 单 
选 按钮 ， 则 表示 不 使 用 正确 判断 的 收益 函数 ; 如 勾 选 “定制 ” 单 选 按钮 ， 用 户 可 以 在 “收入 和 
费用 值 ”二 维 表 中 设 定 自 定义 收入 与 费用 ， 系 统 将 自动 计算 出 利润 。 


CRT 


和 QUEST 算法 的 “选项 ”按钮 


在 “生长 法 ”下 拉 列 表 框 中 选择 CRT 或 QUEST 算法 ， 然 后 单 击 “选项 ”按钮 ， 将 弹出 
“决策 树 : 选项 ”对 话 框 。 
“ 先 验 概率 ”选项 卡 如 图 12-51 所 示 。 


310 


过: 选 头 x pe 选项 x 
EY 加 作用 样本 (经验 先 这 ) 中 天 加) 
O 宇 O) 口才 8 之 同人 等 E) 
收入 和 于 用 值 [E) © WC) 

XP 
(Si 将 自动 8j 什 进行 慰 矢 

请 为 个 类 别 界 入 收入 和 用 信 村 自动 计 革 利 辣 中 使 用 洁 订 分类 也 本 调 玫 兴 上) 

(me) mn Lm [TE 
图 12-50 “利润 ”选项 卡 图 12-51 “ 先 验 概率 ”选项 卡 


。 选中 “从 训练 样本 (经验 先 验 ) 中 获取 ” 单 选 按钮 ,系统 将 自动 从 训练 样本 中 生成 先 验 概率 ; 
。 选中 “在 各 类 别 之 间 相 等 ” 单 选 按钮 ， 系统 将 为 因 变 量 的 各 取 值 水 平 设置 相同 的 先 验 概率 ; 
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。 选中 “定制 ” 单 选 按钮 ， 用 户 可 以 在 “ 先 验 ” 二 维 表 中 设置 自 定义 先 验 概率 。 


12.3.3 ”实验 操作 


下 面 仍 以 数据 文件 “12-1” 为 例 , 讲解 决策 树 分 析 的 具体 操作 过 程 并 对 输出 结果 进行 说 明 。 
1. 实验 数据 描述 


数据 文件 “12-1” 已 在 12.1.3 节 进 行 了 详细 描述 ， 这 里 不 再 资 述 。 本 实验 取 其 中 700 位 已 
经 获得 贷款 的 客户 作为 观测 进行 决策 数 分 析 。 

2. 实验 操作 步骤 

实验 的 具体 操作 步骤 如 下 : 

于 7 在 菜单 栏 中 选择 “分 析 ”|“ 分 类 ”|“ 树 ”命令 ， 打 开 “ 决 策 树 ” 对 话 框 。 

人 ES362 从 源 变 量 列 表 框 中 选择 “年 龄 ”“ 教 育 ”““ 工 龄 “地 址 ”“ 收 入 ”“ 负 债 率 ”“ 信 用 卡 
负债 ”和 “其 他 负债 ”变量 ， 单 击 国 ] 按 钮 将 它们 选 入 “ 自 变量 ”列表 中 ; 从 源 变 量 
列表 框 中 选择 “违约 ”变量 ， 将 其 选 入 “ 因 变 量 ” 列 表 框 中 。 

GE363 单 击 “类 别 ” 按 钮 ， 弹 出 “决策 树 : 类 别 ” 对 话 框 ， 选 中 类 别 “ 是 ”后 的 复 选 框 ， 
单 击 “继续 ”按钮 。 

下 3704 在 “生长 法 ”下 拉 列 表 框 中 选择 CHAID 算法 。 

GES365 再 单 击 “ 选 项 ”按钮 ， 弹 出 “决策 树 : 选项 ”对 话 框 ， 单 击 “ 错 误 分 类 成 本 ”选项 卡 ， 
选中 “定制 ” 单 选 按钮 在“ 否 ” 行 与 “是 ” 列 交 又 单元 格 中 输入 0.8， 表 示 对 将 未 违 
约 者 判定 为 违约 者 的 错 判 惩罚 要 小 于 将 违约 者 错 判 为 未 违约 者 ， 单 击 “ 继 续 ” 按 钮 。 

人 GE365 单 击 “确定 ”按钮 ， 便 可 以 得 到 决策 树 分 析 的 结果 。 


3. 实验 结果 及 分 析 


SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 12-52~ 图 12-55 所 示 。 
图 12-52 给 出 了 模型 的 相关 信息 ， 如 因 变 量 、 自 变量 、 生 长 法 等 。 此 外 ， 该 图 还 给 出 了 最 
终 输出 模型 的 相关 信息 。 


模型 摘要 
其 定 项 “生长 法 CHAID 
因 变 重 是 否 留 经 赴约 
自 变 各 年 龄 , 教育 水 平 , 当前 座 方 工作 年 


限 , 当前 地 址 居住 年 限 , 家庭 收入 
《 千 元 ) , 负债 收入 比率 《x100》， 
信用 卡 负 俩 《和 后 元 ) , 其 他 负 仁 

) 


验证 无 

最 大 树 深度 3 

父 节点 中 的 最 小 个案 数 100 

子 节 点 中 的 号 小 个 要 数 50 
招 果 。。 包括 的 自 变星 全 信 收入 比率 x100), 当前 麻 方 

工作 年 限 , 当前 地 址 居住 年 限 

-有数 13 

等 甘 节 点 数 

民 度 
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号 位 
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图 12-53 给 出 了 最 终 输 出 的 决策 树 。 用 户 可 以 隐藏 和 显示 选择 的 树枝 ， 改 变 颜色 和 字体 ， 
依据 选择 的 节点 选择 个 案 的 子 集 。 


1 
呈 抽 信和 比 训 Cl00) 
Adj.P 怒 =0.000, 卡 力 =101 
222. dts 
| 
(4.400, 10.400] 0.q00, 15.900] 
向 名 2 3 
闫 出 % n 美制 % n 
时 西 82.1230 加 彰 697 99 
PR 03 4 
总 计 400 280 着 计 203 142 
当 疙 庶 万 工作 年 限 当 闪 居 万 工作 年 限 条 地 外 大 位 年 | 当 抽 局 万 工作 年 限 
Adj P 全 =0.001, 卡 方 =16 Adj P 便 =0 000. 卡 万 =22. AdiP 诈 =0.005. 卡 方 =11 Adj P 借 =0.016， 卡 方 =9797. 
,d=1 249, d=1 855, dfF1 de1 
| [ 
70 >70 «50 “P 8o oo »00 
V5 ae E87 Yee LE 闻 吾 10 VE 节 吉 12 
% nn| | NN %» nn % nn % % nm % nn % nn % nn 
有 再 6814 4 本 1000 79 严 百 085 74 百 907 150 四 机 577 45 044 54 吕 首 33.3 29 本 004 32 
mg 186 11| | 过 00 0| lag 315 34| lung 903 全 | lang 423 33| lag 156 10| |mg 667 58| lng 300 21 
6 计 84 59 总 计 _113 79 总 诸 15.4 108 间 计 _246 172 总 计 11.1 78 色 计 9.1 64 明 计 124 87 总 计 _76 53 


12-53 ”决策 树 输出 
图 12-54 给 出 了 节点 的 增益 与 风险 信息 ,包括 我 们 感 兴趣 的 因 变 量 取 值 情况 、 目 标 响应 情 


况 、 增 益 百分比 与 节点 百分比 的 比值 和 分 类 的 风险 度 等 信息 。 


节点 的 增益 
LE 增 了 

节点 案 数 “| 百分比 | 个 案 数 | 百分比 响应 指数 

11 87 124% 58 317% 667% 2550% 

9 78 111% 33 180% 423% 161.8% 

12 53 7.6% 21 115% 396% 151.6% 

7 108 15.4% 34 186% 315% 120.4% 风险 

5 59 8.4% 11 60% 186% 71.3% 估算 标准 误差 

10 64 91% 10 55% 156% 59.8% - - 

权 玩 172 24.6% 16 87% 93% 35.6% 一 :212 | .015 

6 79 11.3% 0 0.0% 0.0% 0.0% 生长 法 : CHAID 

生长 法 ， CHAID 因 变 重 ， 是 否 曾经 违 

因 变 每， 是 否 曾经 违约 的 

图 12-54 节点 的 增益 与 风险 
图 12-55 给 出 了 决策 树 模型 进行 分 类 的 汇总 信息 ， 分 类 
我 们 可 以 看 出 总 体 预测 正确 百分比 为 78.0%, 因此 使 用 预测 
决策 树 对 信用 风险 问题 进行 分 析 有 较 高 参考 价值 。 通 过 ”2a 是 “| 正确 百分比 
决策 树 分 析 ， 我 们 可 以 看 出 ， 负 债 收入 比 、 当 前 雇 方 工 a | 一 2 
作 年 限 和 当前 地 址 居住 年 限 是 三 个 主要 的 分 析 因 子 。 。 一 m 一 放 m 一 六 
生长 法 ，CHAID 
因 变 量 : 是 否 曾 经 违 的 


12-55 分 类 汇总 
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12.4 上 机 


第 12 章 


题 


视频 文件 :\ 多 媒体 文件 上 机 题 教学 视频 \chap12.wmv 


E23 
| 村 


视频 文件 ，\ 源 文件 上 机 题 \chap12\… 


12.1 ”以 下 数据 文件 是 关于 我 国 十 个 省 市 发 展 报告 的 部 分 数据 ， 数 据 观测 了 出 9 


寿命 、 


判别 分 析 


E 时 预期 
义务 教育 普及 率 和 人 均 GDP 等 指标 ， 根 据 上 述 指标 将 10 个 省 市 分 为 高 发 展 水 平和 中 


等 发 展 水 平 两 类 ， 分 别 用 “1” 和 “2” 表 示 ， 数 据 文件 如 下 表 所 示 〔〈 数 据 路 径 : 视频 文件 
\sample\ 上 机 题 \chap12\ 习 题 \ 第 12 章 第 一 题 .sav) 。 


省 市 名 分 组 
北京 76 99 5374 1 
上 海 79.5 99 5359 1 
浙江 78 99 5372 1 
河南 72.1 95.9 5242 1 
河北 73.8 TT 5370 1 
辽宁 71.2 93 4250 2 
吉 353 94.9 3412 2 
江苏 70 91.2 3990 4 
安徽 72.8 99 2300 2 
福建 62.8 80.6 3799 2 
青海 68.5 79.3 1950 
湖北 69.9 96.9 2840 
山东 77.6 93.8 5233 
陕西 69.3 90.3 5158 

现在 又 增加 了 青海 、 湖 北 、 山 东 和 陕西 的 数据 ， 但 是 对 它们 没有 分 类 ， 我 们 希望 对 这 几 个 

省 市 归 入 上 述 两 类 ， 请 建立 标准 判别 函数 对 这 四 个 地 区 进行 分 类 。 


12.2 ”为 了 研究 脑溢血 的 发 病 机 制 ， 某 医院 脑 外 科 观 察 了 脑溢血 病人 和 正常 人 的 六 项 指 
标 ， 其 中 脑溢血 病人 为 分 组 序号 为 “1”， 正 常人 为 “0”， 部 分 数据 文件 如 下 表 所 示 ( 数 据 路 
径 : 视频 文件 \sample\ 上 机 题 \chap12\ 习 题 \ 第 12 章 第 二 题 .sav) 。 


总 胆固醇 


甘油 三 脂 | 高 密度 胆固醇 | 低 密度 胆固醇 


载 脂 蛋白 A1 


载 脂 蛋 白 B 


(mg/dl) (mmol/l) (mg/dl) (mmol/l) (mmol/l) 
245 157 168 网 1.01 | 
236 275 1.22 1.12 1 


238 


354 


0.9 


1.06 
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( 续 表 ) 
总 胆固醇 | ”甘油 三 脂 | 高 密度 胆固醇 | 低 密度 胆固醇 | 载 脂 蛋白 A1 | 载 脂 蛋 白 B 分 组 
(mg/dl) (mmol/l) (mg/dl) (mg/dl) mmol (mmol/l) 
233 250 31 150 1.02 0.98 [| 
240 149 35 170 1.26 1.13 1 
235 166 40 164 1.3 L115 1 
204 365 38 90 1.33 0.95 了 
200 95 43 100 1.24 0.98 1 
297 240 38 207 1.14 1.51 1 
77 97 49 108 1.49 1.02 1 
200 172 43 116 125 1.03 1 
195 211 47 106 1.22 0.94 1 
166 217 33 86 ti 0.74 1 
144 111 28 46 0.71 0.65 业 
233 107 42 156 0.95 0.77 1 
143 91 24 108 0.67 0.65 3 
228 223 34 136 1.05 0.84 | 
264 186 41 183 1.22 0.92 1 
178 131 49 98 1.18 1.27 1 
240 ey 33 174 0.78 0.9 1 
180 211 27 106 0.85 0.69 1 
161 91 39 88 0.94 0.52 3 
236 > 38 171 1.01 0.83 1 
168 106 36 104 0.87 0.58 1 
174 141 28 103 0.81 0.73 1 
215 168 38 134 0.88 0.87 1 
268 185 28 203 0.75 0.97 1 


我 们 希望 建立 上 述 指标 与 脑溢血 发 病 之 间 的 联系 ， 以 便 可 以 对 脑溢血 的 发 病 过 


行 早期 诊 


断 , 试用 判别 分 析 方法 建立 脑溢血 病人 的 标准 判别 函数 ,分析 其 作为 早期 预防 诊断 的 依据 如 何 。 
12.3 某 机 构 对 大 学 进行 分 类 ， 将 大 学 分 为 “研究 型 大 学 ”和 “教学 型 大 学 ”， 并 在 数 


据 文件 中 分 别 用 “1” 和 “0” 表 示 ， 现 观测 了 700 所 大 学 的 9 个 指标 的 得 分 ， 部 分 数据 如 下 表 
所 示 〈 数 据 路 径 : 视频 文件 \sample\ 上 机 题 \chap12\ 习 题 \ 第 12 章 第 三 题 .sav) 。 
序号 就 业 得 分 满意 度 得 分 师资 得 分 资源 得 分 分 组 
1 41 3 iy 12 1 
党 27 1 10 6 0 
3 40 1 15 14 0 
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( 续 表 ) 
序号 就 业 得 分 满意 度 得 分 师资 得 分 资源 得 分 分 组 
4 41 和 15 14 0 
E 24 0 i 
6 41 5 0 
7 39 9 0 
8 43 11 0 
9 24 4 1 
10 36 13 0 
11 55 1 0 
12 25 0 0 
13 52 14 0 
14 37 9 0 
15 48 15 0 
16 36 6 1 
17 36 6 
18 43 19 0 
19 39 9 0 


我 们 希望 得 到 几 个 最 重要 的 指标 ， 以 便 对 大 学 的 分 类 有 总 体 的 把 握 。 试 采用 决策 树 分 析 方 
法 ， 分 析 影 响 大 学 分 类 的 主要 因素 。 
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在 现实 研究 过 程 中 , 往往 需要 对 所 反映 事物 、 现象 从 多 个 角度 进行 观测 ， 因 此 研究 者 需要 
设计 出 多 个 观测 变量 , 从 多 个 变量 收集 大 量 数 据 以 便 进行 分 析 寻 找 规律 。 多 变量 大 样本 虽然 会 
为 我 们 的 科学 研究 提供 丰富 的 信息 , 但 却 增加 了 数据 采集 和 处 理 的 难度 。 更 重要 的 是 , 许多 变 
量 之 间 存 在 一 定 的 相关 关系 ， 导 致 了 信息 的 重合 现象 ， 从 而 增加 了 问题 分 析 的 复杂 性 。 
因子 分 析 和 主 成 分 分 析 就 是 将 大 量 的 彼此 可 能 存在 相关 关系 的 变量 ,转换 成 较 少 的 彼此 不 
相关 的 综合 指标 的 多 元 统计 方法 。 这 样 既 可 减轻 收集 信息 的 工作 量 , 又 可 使 各 综合 指标 代表 的 
信息 不 重 登 。 

主 成 分 分 析 利 用 的 是 “ 降 维 ”的 思想 ， 利 用 原始 变量 的 线性 组 合 组 成 主 成 分 。 在 信息 损失 
较 小 的 前 提 下 ， 把 多 个 指标 转化 为 几 个 互补 相关 的 综合 指标 。 

因子 分 析 是 主 成 分 分 析 的 扩展 和 推广 ， 通 过 对 原始 变量 的 相关 系数 矩阵 内 部 结构 的 研究 ， 
导出 能 控制 所 有 变量 的 少数 几 个 不 可 观测 的 综合 变量 ,通过 这 少数 几 个 综合 变量 去 描述 原始 的 
多 个 变量 之 间 的 相关 关系 。 


13.1 因子 分 析 


13.1.1 因子 分 析 的 原理 


因子 分 析 (Factor Analysis) 是 一 种 数据 简化 的 技术 。 它 通过 研究 众多 变量 之 间 的 内 部 依 
赖 关系 ,探求 观测 数据 中 的 基本 结构 ,并 用 少数 几 个 独立 的 不 可 观测 变量 来 表示 其 基本 的 数据 
结构 。 这 几 个 假想 变量 能 够 反映 原来 众多 变量 的 主要 信息 。 原 始 的 变量 是 可 观测 的 显 式 变量 ， 
而 假想 变量 是 不 可 观测 的 潜在 变量 ， 称 为 因子 。 
因子 分 析 的 基本 步骤 如 下 。 
1) 对 数据 进行 标准 化 处 理 
2) 估计 因子 载荷 矩阵 


因子 分 析 的 基本 模型 如 下 : 


,=ub tasb Ft bo, 


Z,=ayF +asb +*…+a,F, +cU, 
2 = tba b+, 
其 中 乙 、22 一 2 为 原始 变量 ， 五 、 五 一 三 为 公共 因子 ， 表 示 为 失 阵 形式 为 : 


Z=4-F+ C U 
(mpd) (mxp) (PxD) (mm) (mxl) 
(对 角 阵 ) 
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了 4 为 因子 载荷 和 矩阵， 估算 因子 载荷 矩阵 的 方法 有 主 成 分 法 、 映 像 因 子 法 、 加 权 最 小 二 乘 
法 、 最 大 似 然 法 等 。 

3) 因子 旋转 

建立 因子 分 析 数 学 模型 的 目的 不 仅 要 找 出 公共 因子 并 对 变量 进行 分 组 ， 更 重要 的 是 要 知 
道 每 个 公共 因子 的 意义 ， 以 便 对 实际 问题 作出 科学 分 析 。 当 因子 载荷 矩阵 4 的 结构 不 便 对 主 
因子 进行 解释 时 ， 可 用 一 个 正 交 阵 右 乘 4 ( 即 对 4 实施 一 个 正 交 变换 ) 。 由 线性 代数 知识 ， 对 
4 施行 一 个 正 交 变换 ， 对 应 坐标 系 就 有 一 次 旋转 ， 便 于 对 因子 的 意义 进行 解释 。 

4) 估计 因子 得 分 

以 公共 因子 表示 原因 变量 的 线性 组 合 , 而 得 到 因子 得 分 函数 。 我 们 可 以 通过 因子 得 分 函数 
计算 观测 记录 在 各 个 公共 因子 上 的 得 分 ， 从 而 解决 公共 因子 不 可 观测 的 问题 。 


13.1.2 ”因子 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 
后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 进 
行 因子 分 析 。 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 降 维 ”| “因子 ” 
命令 ， 打 开 如 图 13-1 所 示 的 “因子 分 析 ” 对 话 框 。 

2) 选择 变量 。 

从 源 变量 列表 框 中 选择 需要 进行 因子 分 析 的 
变量 ， 然 后 单 击 箭头 国 按钮 将 选中 的 变量 选 入 “ 变 
量 ” 列 表 框 中 ; 如果 不 使 用 全 部 样本 分 析 ， 可 以 从 
源 变量 列表 框 中 选择 因子 变量 , 然后 单 击 箭头 国 按 图 13-1 “因子 分 析 ” 对 话 框 
钮 将 选中 的 变量 选 入 “选择 变量 ”列表 框 中 。 其 中 : 


。 “变量 ”列表 框 : 该 列表 框 中 的 变量 为 要 进行 因子 分 析 的 目标 变量 ， 变 量 在 区 间或 比率 级 
别 应 该 是 定量 变量 。 分 类 数据 ( 如 性 别 等 ) 不 适合 因子 分 析 。 另 外， 可 计算 皮尔 逊 相关 系 
数 的 数据 应 该 适合 于 因子 分 析 。 

。 “选择 变量 ”列表 框 : 该 列表 框 中 的 变量 用 来 限定 仅 对 含有 指定 个 案 的 变量 集 进行 因子 分 
析 。 当 用 户 决定 对 满足 某 个 条 件 的 变量 进行 分 析 时 ， 可 以 在 此 指定 选择 变量 ， 此 时 “ 值 
按钮 就 会 被 激活 。 单 击 “ 值 ”按钮 ， 将 弹出 如 图 13-2 所 示 的 对 话 框 ， 在 “选择 变量 值 ” 文 
本 框 中 输入 指定 的 整数 值 ， 然 后 单 击 “ 继 续 ” 按 钮 ， 则 因子 分 析 中 仅 使 用 具有 该 选择 变量 
值 的 个 案 。 


3) 设置 相应 的 选项 。 
“描述 ”按钮 
单 击 “ 描 述 ”按钮 ， 弹 出 如 图 13-3 所 示 的 “因子 分 析 : 描述 ”对 话 框 。 


“因子 分 析 : 描述 ”对 话 框 主要 用 于 设置 对 原始 变量 的 基本 描述 并 对 原始 变量 进行 相关 性 
分 析 。 


Q “统计 ”选项 组 。 该 选项 组 主要 用 于 设置 原始 变量 的 基本 描述 和 原始 分 析 ， 包 括 : 


六 回放 溢 产 投 次 

人 社会 消费 品 轨 信号 频 国 
农村 人 人均 入 

入 科研 机 构 数 里 

六 卫生 机 构 才 量 
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图 13-2 


器 系数 O 回 逆 IO) 

器 显著 性 水 平 (S) 丫 再 生 (R) 
回 决定 因子 D) 器 反映 像 W) 
丫 KMO 和 巴特 利 桂 球形 度 检验 


“因子 分 析 : 设置 值 ” 对 话 框 13-3 “因子 分 析 : 描述 ”对 话 框 


。 “ 单 变量 描述 ” 复 选 框 : 选中 该 复 选 框 , 表示 输出 每 个 变量 的 均值 、 标 准 差 和 有 效 个 案 数 ; 
。 “初始 解 ” 复 选 框 : 选中 该 复 选 框 ， 表 示 输 出 初始 公 因子 方差 、 特 征 值 ( 即 协 方差 矩阵 对 
角 线 上 的 元 素 ) 和 已 解释 方差 的 百分比 。 
@ “相关 性 矩阵 ”选项 组 。 该 选项 组 主要 用 于 对 输出 的 相关 甜 阵 进行 必要 的 设置 ， 各 复 
选 框 的 功能 如 表 13-1 所 示 。 


表 13-1 相关 和 矩阵 选项 组 中 个 复 选 框 名 称 及 其 功能 


复 选 框 名 称 复 选 框 功能 

系数 表示 输出 原始 变量 之 间 的 相关 系数 和 矩阵， 如 果 相关 系数 矩阵 中 的 大 部 分 系数 都 小 于 0.3， 
即 变量 之 间 大 多 为 弱 相 关 ， 原 则 上 不 适合 进行 因子 分 析 

显著 性 水 平 pct 相应 的 原 假设 是 相关 系数 

0 

决定 因子 表示 输出 相关 系数 矩阵 的 行列 式 

逆 表示 输出 相关 系数 矩阵 的 逆 矩 阵 

再 生 表示 输出 从 因子 解 估计 的 相关 和 矩阵, 还 显示 残 差 (估计 相关 性 和 观察 相关 性 之 间 的 差分 》 
表示 输出 反映 像 相 关 和 矩阵 ， 反 映像 相关 和 矩阵 包含 偏 相关 系数 的 相反 数 ， 而 反映 像 协 方差 

反映 像 矩阵 包含 偏 协 方差 的 相反 数 ， 在 一 个 好 的 因子 模型 中 ， 对 角 线 上 的 元 素 值 比较 接近 1， 
而 大 部 分 非 对 角 线 的 元 素 将 会 很 小 ， 其 中 反映 像 相关 和 矩阵 的 对 角 线 上 的 元 素 又 称 为 变量 
的 取样 充分 性 度量 (MSA) 

KMo 与 巴特 利 其 中 KMO 统计 量 用 于 比较 变量 间 简 单 相关 系数 矩阵 和 偏 相关 系数 的 指标 , KMO 值 越 接 

特 球形 度 检验 近 1 表示 越 适 合 做 因子 分 析 , 而 巴特 利 特 球形 度 检验 的 原 假设 为 相关 系数 矩阵 为 单位 阵 ， 
如 果 Sig 值 拒绝 原 假设 表示 变量 之 间 存在 相关 关系 ， 因 此 适合 做 因子 分 析 

“提取 ”按钮 


单 击 “ 提 取 ” 按 钮 ， 弹 出 如 图 13-4 所 示 的 “因子 分 析 : 提取 ”对 话 框 。 
该 对 话 框 主 要 用 于 设置 提取 公共 因子 的 方法 和 公共 因子 的 个 数 。 
中 “方法 ”下 拉 列 表 框 。 该 列表 框 主要 用 于 设 定 提取 公共 因子 的 方法 ， 各 方法 及 其 功能 


如 表 13-2 所 示 。 
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起 四 了 分 折 : 更 取 x 


| 
| uw EE 


分 析 [a 


加 相关 性 ;ES(E) 
目 协 方差 ;EBD 


捏 可 
加 基于 特征 值 E) 

特 证 值 大 于 他: 1 
站 因子 的 国定 孝 目 (N) 

要 提取 的 因 于 青 四 : 


| 


EH 
图 13-4 “因子 分 析 : 提取 ”对 话 框 
表 13-2 “方法 ”下 拉 列 表 框 中 的 方法 及 其 功能 


方法 名 称 方法 内 容 与 功能 
该 方法 用 于 形成 原始 变量 的 不 相关 的 线性 组 合 , 其 中 第 一 个 成 分 具有 最 大 的 方差 , 后 面 


主 成 分 的 成 分 对 方差 解释 的 比例 逐渐 变 小 , 它们 相互 之 间 均 不 相关 , 主 成 分 分 析 用 来 获取 最 初 
因子 解 并 且 它 可 以 在 相关 和 矩阵 是 奇异 矩阵 时 使 用 

未 加 权 最 小 平方 | 该 方法 可 以 使 观察 的 相关 系数 矩阵 和 再 生 的 相关 系数 矩阵 之 间 的 差 的 平方 值 之 和 最 小 
该 方法 同 未 加 权 最 小 平方 法 , 但 是 相关 系数 要 进行 加 权 ， 权重 为 它们 单 值 的 倒数 ,这 样 
单 值 高 的 变量 ， 其 权重 比 单 值 低 的 变量 的 权重 小 
在 样本 来 自 多 变量 正 态 分 布 的 情况 下 , 它 生成 的 参数 估算 最 有 可 能 生成 观察 到 的 相关 甜 


广义 最 小 平方 


以 钞 
人 阵 ， 将 变量 单 值 的 倒数 作为 权重 对 相关 性 进行 加 权 ， 并 使 用 迭代 算法 
在 初始 相关 系数 矩阵 中 , 多 元 相关 系数 的 平方 放置 于 对 角 线 上 作为 公 因子 方差 的 初始 估 
主轴 因 式 分 解 算 值 ,然后 这 些 因子 载荷 用 来 估算 蔡 换 对 角 线 中 的 旧 公 因子 方差 和 估算 值 的 新 的 公 因 子 


方差 , 继续 迭代 , 直到 某 次 欠 代 和 下 次 迭代 之 间 公 因子 方差 的 改变 幅度 能 满足 抽取 的 收 
敛 条 件 

Alpha 因 式 分 解 | 该 方法 将 分 析 中 的 变量 视 为 来 自 潜在 变量 全 体 的 一 个 样本 , 使 因子 的 Alpha 可 靠 性 最 大 
该 方法 将 变量 的 公共 部 分 〈 称 为 偏 映像 ) 定义 为 其 对 剩余 变量 的 线性 回归 ,， 而 非 假设 因 
子 的 函数 ， 实 际 上 是 使 用 多 元 回归 的 方法 提取 因子 


@@ “分 析 ” 选 项 组 。 该 选项 组 用 于 指定 相关 和 拖 阵 或 协 方差 矩阵 ， 包 括 : 


。 “相关 性 矩阵 ” 单 选 按钮 选中 该 单 选 按钮 ， 表 示 以 相关 性 矩阵 作为 提取 公共 因子 的 依 
据 ， 当 分 析 中 使 用 不 同 的 尺度 测量 变量 时 比较 适合 

。 “ 协 方差 矩阵 ” 单 选 按钮 : 选中 该 单 选 按钮 ， 表 示 以 协 方差 矩阵 作为 提取 公共 因子 的 依 
据 ， 当 因子 分 析 应 用 于 每 个 变量 具有 不 同方 差 的 多 个 组 时 比较 适用 。 


@@ “输出 ”选项 组 。 该 选项 组 用 于 指定 输出 的 因子 解 和 特征 值 的 碎 石 图 ， 包 括 : 


。 “未 旋转 因子 解 ” 复 选 框 : 选中 该 单 选 按钮 ， 表 示 输 出 未 旋转 的 因子 载荷 ( 因子 模式 矩 
阵 ) 、 公 因子 方差 和 因子 解 的 特征 值 ; 


映像 因 式 分 解 
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旋转 ”对 话 框 。 
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@ “最 大 收敛 迭代 次 数 ” 文 本 框 。 该 文本 框 用 于 指 
定 算法 过 程 所 采取 的 最 大 步骤 数 。 系 统 默认 为 25 次 。 


“旋转 ”按钮 


“ 碎 石 图 ” 复 选 框 : 选中 该 单 选 按钮 ， 表 示 输 出 与 每 个 因子 相关 联 的 特征 值 的 图 ， 该 图 用 
于 确定 应 保持 的 因子 个 数 ， 通常 该 图 显示 大 因子 的 陡峭 斜率 和 剩余 因子 平缓 的 尾部 之 间 明 
显 的 中 断 ( 碎 石 ) 。 


“提取 ”选项 组 。 该 选项 组 用 于 指定 抽取 因子 的 数目 。 包 括 : 


“基于 特征 值 ”: 选中 该 单 选 按钮 ， 表 示 抽 取 特 征 
值 超过 指定 值 的 所 有 因子 ， 可 在 “特征 值 大 于 ” 文 
本 框 中 指定 值 ， 一 般 为 1; 

“因子 的 固定 数目 ”: 选中 该 单 选 按钮 ， 表 示 保 留 
特定 数量 的 因子 ， 在 “要 提取 的 因子 ”文本 框 中 输 
入 要 保留 因子 的 数目 。 


瞧 因子 分 析 : 旋转 


2 一 一 一 一 一 一 
@ 无 由 日 四 次 申 极 大 法 (Q) 
日 最 大 方差 法 (VW) 。 〇 等 量 最 大 法 (E) 
上 直接 料 交 法 (O) ”加 最 优 科 交 法 (EP) 


Dela: jo Kappa 


辅 出 
图 半生 后 和 月 (B 加 载 菏 图 (L) 


最 大 收效 适 代 次 数 00: 125 


单 击 “ 旋 转 ” 按钮， 弹出 如 图 13-5 所 示 的 “因子 分 析 : 


图 13-5 “因子 分 析 : 旋转 ”对 话 框 


“因子 分 析 : 旋转 ”对 话 框 主要 用 于 设置 因子 旋转 的 方法 ， 进 而 可 以 命名 因子 。 
@ “方法 ”选项 组 。 该 选项 组 主要 用 于 设置 因子 旋转 的 方法 ， 包 括 : 


© 


无 : 表示 不 进行 任何 因子 旋转 ; 

最 大 方差 法 ， 是 一 种 正 交 旋转 方法 ， 它 使 得 对 每 个 因子 有 高 负载 的 变量 数目 达到 最 小 ， 并 
简化 因子 的 解释 ; 

直接 斜 交 法 : 是 一 种 斜 交 旋转 方法 ， 当 delta 等 于 0 时, 解 是 最 斜 交 的 ， 当 delta 负 值 越 大 ， 
因子 的 斜 交 度 就 越 低 ， 其 中 要 覆盖 默认 的 delta 值 0， 可 以 在 下 方 的 Delta 文本 框 中 输入 小 
于 等 于 0.8 的 数 ; 

四 次 宕 极 大 法 : 又 称 为 最 大 正 交 旋转 法 , 该 方法 使 得 每 个 变量 中 需要 解释 的 因子 数目 最 少 ， 
可 以 简化 对 变量 的 解释 ; 

等 量 最 大 法 : 该 方法 是 最 大 方差 法 与 四 次 备 极 大 法 的 结合 ， 可 以 使 高 度 依赖 因子 的 变量 个 
数 及 解释 变量 所 需 的 因子 个 数 最 少 ; 

最 优 斜 交 法 : 该 方法 可 使 因子 相关 联 ， 可 比 直接 最 小 斜 交 旋转 更 快 地 计算 出 来 ， 因 此 适用 
于 大 型 数据 集 。 


“输出 ”选项 组 。 该 选项 组 主要 用 于 指定 是 否 输出 旋转 解 和 载荷 图 : 


旋转 后 的 解 : 该 复 选 框 只 有 在 选择 了 旋转 方法 后 才能 有 效 ， 对 于 正 交 旋转 会 显示 已 旋转 的 
模式 矩阵 和 因子 变换 矩阵 ， 对 于 斜 交 旋转 会 显示 模式 、 结 构 和 因子 相关 矩阵 ; 

载荷 图 : 表示 输出 前 三 个 因子 的 三 维 因子 载荷 图 ， 而 对 于 双 因 子 解 ， 则 显示 二 维 图 ， 
如 果 只 抽取 了 一 个 因子 ， 则 不 显示 图 。 
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加 “最 大 收敛 迭代 次 数 ” 文本 框 。 该 文本 框 用 于 指定 算法 执行 旋转 所 采取 的 最 大 步骤 数 ， 
默认 为 25 次 。 
“得 分 ”按钮 
单 击 “得 分 ”按钮 ， 弹 出 如 图 13-6 所 示 的 “因子 分 析 : 因子 得 分 ”对 话 框 。 
“因子 分 析 : 因子 得 分 ”对 话 框 主要 用 于 计算 因子 得 分 ， 包 括 : 
“方法 ”选项 组 。 该 选项 组 主要 用 于 计算 因子 得 分 的 方法 ， 包 括 : 
。 回归 : 该 方法 得 到 的 因子 得 分 的 均值 为 0， 方差 等 于 估计 的 因子 分 数 和 真正 的 因子 值 之 
间 的 平方 多 相关 性 ， 其 中 即使 因子 是 正 交 的 ， 分 数 也 可 能 相关 ; 
。 巴特 利 特 : 该 方法 尽管 所 产生 因子 得 分 的 均值 为 0， 但 使 整个 变量 范围 中 所 有 唯一 因子 
的 平方 和 达到 最 小 ; 
。 安德森 - 鲁 宾 : 即 修正 的 巴特 利 特 方法 ， 该 方法 确保 被 估计 的 因子 的 正 交 性 所 产生 因子 
得 分 的 均值 为 0， 标准 差 为 1， 且 不 相关 。 
@ “保存 为 变量 ” 复 选 框 。 该 复 选 框 用 于 对 每 个 因子 得 分 创建 一 个 新 变量 ， 且 只 有 选中 
该 复 选 框 才能 进行 “方法 ”的 设 定 。 
@ “显示 因子 得 分 系数 和 矩阵” 复 选 框 。 该 复 选 框 主要 用 于 输出 因子 得 分 的 系数 矩阵 及 因 
子 得 分 之 间 的 相关 性 矩阵 。 
“选项 ”按钮 
单 击 “ 选 项 ”按钮 ， 弹 出 如 图 13-7 所 示 的 “因子 分 析 : 选项 ”对 话 框 。 


日 显示 因子 得 分 系数 jp(D) 


图 13-6 “因子 分 析 : 因子 得 分 ”对 话 框 图 13-7 “因子 分 析 : 选项 ”对 话 框 
“因子 分 析 : 选项 ”对 话 框 主要 用 于 设置 对 变量 缺失 值 的 处 理 和 系数 显示 的 格式 。 
(“缺失 值 ”选项 组 。 该 选项 组 主要 用 于 指定 如 何 处 理 缺 失 值 ， 包 括 : 


。 成 列 排除 个 案 : 选中 该 单 选 按钮 , 表示 排除 在 任何 分 析 中 所 用 的 任何 变量 有 缺失 值 的 个 案 ; 
。 成 对 排除 个 案 : 选中 该 单 选 按钮 , 表示 从 分 析 中 排除 变量 对 中 有 一 个 或 两 个 缺失 值 的 个 案 ; 
。 替换 为 平均 值 : 选中 该 单 选 按钮 ， 表 示 将 缺失 值 用 变量 均值 代替 。 


@“ 系 数 显示 格式 ”选项 组 。 该 选项 组 主要 用 于 指定 系数 矩阵 的 显示 格式 : 
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。 按 大 小 排序 : 选中 该 复 选 框 ， 表 示 按 大 小 对 系数 矩阵 进行 排序 ; 

。 排除 小 系数 : 选中 该 复 选 框 ， 表示 只 显示 绝对 值 大 于 指定 值 的 符合 系数 ， 可 以 在 “绝对 值 
如 下 ”文本 框 中 输入 指定 值 ， 系 统 默认 为 0.10。 

4) 分 析 结 果 输 出 。 

设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 因子 分 析 的 结果 。 


13.1.3 ”实验 操作 
下 面 将 以 数据 文件 “13-1” 为 例 ， 讲 解 因子 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 
1. 实验 数据 描述 
数据 文件 “13-1” 给 出 的 是 衡量 我 国 各 省 市 综合 发 展 情况 的 一 些 数据 ， 数 据 来 源 于 《中 国 
统计 年 鉴 》。 数 据 表 中 选取 了 6 个 指标 ， 分 别 是 人 均 GDP、 固 定 资产 投资 、 社 会 消费 品 零售 
总 额 、 农 村 人 均 纯 收入 、 科 研 机 构 数 量 、 卫生 机构 数量 , 下 面 将 利用 因子 分 析 来 提取 公共 因子 ， 
分 析 衡量 发 展 因素 的 指标 。 实 验 的 原始 数据 如 图 13-8 所 示 。 


2406 
1668 
1206 
1208 
1756 
1609 
1766 
4245 
2456 
2966 
1302 
2048 
1537 
1715 
1231 
1511 
1425 
2699 
1446 
1519 
1158 
1086 
1010 

962 


图 13-8 数据 文件 “13-1” 原 始 数据 


在 SPSS 的 变量 视图 中 ， 建 立 “ 地 区 ”变量 ， 表 示 各 个 省 市 ， 建 立 “ 人 均 GDP”“ 固 定 资 
产 投 资 ”“ 社 会 消费 品 零售 总 额 ”“ 农 村 人 均 纯 收 入 ”“ 科 研 机 构 数量 ”和 “卫生 机 构 数量 ” 
变量 ， 表 示 各 发 展 衡量 指标 ， 如 图 13-9 所 示 。 

在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ， 输 入 完毕 后 的 部 分 
数据 如 图 13-10 所 示 。 


Es 


一 型 
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| 上 : 因 了 他 sav 其 所 和 折 1] - BM SPSS Statistics 数据 尝 生 各 = 口 六 
[xHD ME ED go HAD SW BND BRAG) AREF FR EN MD 


1BM SPSS Slatsbcs 外 于 各 就 绩 | | [Unicode ON 


图 13-9 “13-1” 数 据 文件 的 变量 视图 


办 * 罗 了 分 析 极 泥 sav [ 政 握 先 1] - BM SPSS Statistics 数据 将 所 只 


BM SPSS Statstcs 外 音程 序 尝 绩 | |UnicodeON| | | 


图 13-10 “13-1” 数 据 文件 的 数据 视图 


2. 实验 操作 步骤 


HWY 打开 数据 文件 “13-1”， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 降 维 ”| “因子 ”选项 卡 ， 打 开 “ 因 子 分 析 ” 对 话 框 ， 将 “人 均 GDP”“ 国 定 
资产 投资 "“ 社 会 消费 品 零 售 总 额 "“ 农 村 人 均 纯 收入 ”“ 科 研 机 构 数 量 ” 和 “卫生 机 
构 数量 ”变量 先入 “变量 ”列表 框 中 。 

人 ES02 单 击 “描述 ”按钮 ， 在 “因子 分 析 : 描述 ”对 话 框 中 选中 “初始 解 ” 复 选 框 和 “KMO 
和 巴特 利 特 的 球形 度 检验 ” 复 选 框 ， 单 击 “ 继 续 ”按钮 ， 保 存 设置 结果 。 

ES63 单 击 “ 提 取 ” 按 钮 ， 在 “因子 分 析 : 提取 ”对 话 框 中 选中 “ 碎 石 图 ” 复 选 框 ， 其 他 
为 系统 默认 选择 ， 单 击 “继续 ”按钮 保存 设 置 结果 。 
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下 704 单 击 “旋转 ”按钮 ， 在 “因子 分 析 : 旋转 ”对 话 框 中 选中 “最 大 方差 法 ” 复 选 框 ， 

其 他 为 系统 默认 选择 ， 单 击 “继续 ”按钮 保存 设置 结果 。 

本 3705 单 击 “ 得 分 ”按钮 ， 在 “因子 分 析 : 因子 得 分 ”对 话 框 中 选中 “保存 为 变量 ”和 “ 显 
示 因 子 得 分 系数 矩阵 ” 复 选 框 ， 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 结果 。 


3. 实验 结果 及 分 析 


单 击 “ 确 定 ”按钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 13-11~ 图 13-18 所 示 。 

图 13-11 给 出 了 KMO 和 巴特 利 特 的 检验 结果 ， 其 中 KMO 值 越 接近 1 表示 越 适 合 做 因子 
分 析 ， 从 中 可 以 看 到 KMO 的 值 为 0.635， 表 示 比 较 适 合 做 因子 分 析 。 巴 特 利 特 球形 度 检 验 的 
原 假 设 为 相关 系数 矩阵 是 单位 阵 ，Sig 值 为 0.000， 小 于 显著 水 平 0.05， 因 此 拒绝 原 假设 ， 说 
明 变 量 之 间 存 在 相关 关系 ， 适 合 做 因子 分 析 。 

图 13-12 给 出 了 每 个 变量 共同 度 的 结果 。 左 侧 表示 每 个 变量 可 以 被 所 有 因素 所 能 解释 的 方 
差 ， 右 侧 表示 变量 的 共同 度 。 从 图 中 可 以 看 到 ， 因 子 分 析 的 变量 共同 度 都 非常 高 ， 表 明 变 量 中 
的 大 部 分 信息 均 能 够 被 因子 所 提取 ， 说 明 因子 分 析 的 结果 是 有 效 的 。 


公 因 子 方差 
初 姓 提取 
人 为 GDP 1.000 930 
国定 资产 投 次 1.000 721 
KMO 和 巴特 利 特 检验 社会 消费 品 至 售 总 闫 1.000 .795 
KMO 取样 适 切 改 草 数 。 635 农村 人 均 纯 收 入 1.000 961 
巴特 利 特 球形 度 检验 。 近似 卡 方 148.798 科研 机 构 数 合 1.000 847 
自由 度 15 卫生 机 构 数 重 1.000 859 
显著 性 000 提取 方法 ， 主 成 分 分 析 法 。 
图 13-11 KMO 和 巴特 利 特 的 检验 13-12 变量 共同 度 结果 


图 13-13 给 出 了 因子 贡献 率 的 结果 。 左 侧 部 分 为 初始 特征 值 ， 中 间 为 提取 主因 子 结果 ， 右 
侧 为 旋转 后 的 主因 子 结果 。“ 总 计 ” 指 因子 的 特征 值 ， “方差 百分比 ”表示 该 因子 的 特征 值 占 
总 特征 值 的 百分比 ，“ 累 积 %” 表 示 累 积 的 百分比 。 其 中 只 有 前 两 个 因子 的 特征 值 大 于 1， 并 
且 前 两 个 因子 的 特征 值 之 和 占 总 特征 值 的 85.22%， 因 此 ， 提 取 前 两 个 因子 作为 主因 子 。 


总 方差 解释 
初始 特征 值 提取 载荷 平方 和 将 转载 葫 平方 和 

成 分 。 总计 “| 方差 百分比 | 累积 % ”总 计 “| 方差 百分比 | 累积 % ”。 总 计 | 方 着 分 比 | 累积 % 
1 3327 55.449 55449 3327 55449 55449 2796 46.605 。 46.605 
2 1.786 29771 85.220 1.786 29771 85220 2.317 38.614 85.220 
3 .497 8.285 93.505 
4 262 4362 97.867 

5 088 1.473 99.340 

6 040 .660 100.000 


提取 方法 ， 主 成 分 分 本 法 。 
13-13 ”因子 贡献 率 结果 
图 13-14 给 出 了 未 旋转 的 因子 载荷 。 从 中 可 以 看 到 利用 主 成 分 方法 提取 的 两 个 主因 子 的 载 
荷 值 。 为 了 方便 解释 因子 含义 ， 需 要 进行 因子 旋转 。 


324 


第 13 章 因子 分 析 和 主 成 分 分 析 


图 13-15 给 出 了 旋转 后 的 因子 载荷 值 ,其 中 旋转 方法 采用 的 是 Kaiser 标 准 化 的 正 交 旋转 法 。 
通过 因子 旋转 ， 各 个 因子 有 了 比较 明确 的 含义 。 


成 分 矩阵 旋转 后 的 成 分 矩阵 
成 分 成 分 
1 3 1 2 
人 区 GDP 831 -490 人 0 wl 
圈定 恬 产 投 改 .732 430 国定 资产 投资 340 778 
社会 消 绵 吕 丰 入 总 大 7 a 社会 消费 品 鹤 仿 总额 .885 109 
CR 人 
科研 机 构 数 全 .694 .605 eT 3 
卫生 机 构 数 重 461 804 “提取 方法 ， 主 成 分 分 WE 
提取 方法 ， 主 成 分 分 析 法 。 旋转 方法 塌 化 最 大 方差 法 。 
a. 提取 了 2 个 成 分 。 .旋转 在 3 次 旬 代 后 已 收效 。 
图 13-14 未 旋转 的 因子 载荷 13-15 ”旋转 的 因子 载荷 值 


图 13-16 给 出 了 特征 值 的 碎 石 图 ， 通 常 该 图 显示 大 因子 的 陡峭 斜率 和 剩余 因子 平缓 的 尾 
部 , 之 间 有 明显 的 中 断 。 一 般 选 取 主 因子 在 非常 陡峭 的 斜率 上 ， 而 处 在 平缓 斜率 上 的 因子 对 变 
异 的 解释 非常 小 。 从 该 图 可 以 看 出 前 两 个 因子 都 处 在 非常 陡峭 的 斜率 上 , 从 第 三 个 因子 开始 和 斜 
率 变 平缓 ， 因 此 选择 前 两 个 因子 作为 主因 子 。 


碎 石 图 


组 件 号 
图 13-16 碎 石 图 


13-17 给 出 了 成 分 得 分 系数 矩阵 ,图 13-18 给 出 了 由 成 分 得 分 系数 矩阵 计算 的 因子 得 分 。 
其 中 成 分 得 分 系数 矩阵 是 计算 因子 得 分 的 依据 ,图 13-18 的 结果 是 由 图 13-17 提供 的 计算 公式 
得 到 的 。 另 外 ， 由 因子 得 分 可 以 进一步 计算 综合 得 分 。 

通过 因子 分 析 可 以 看 出 , 每 个 因子 只 有 少数 几 个 指标 的 因子 载荷 较 大 , 因此 可 将 6 个 指标 
按 高 载荷 分 成 两 类 : 人 均 GDP、 社 会 消费 品 零售 总 额 和 农村 人 均 纯 收入 变量 在 第 一 个 因子 上 
载荷 较 大 ， 可 以 将 第 一 个 因子 命名 为 经 济 发 展 因子 ; 固定 资产 投资 、 科 研 机 构 数量 和 卫生 机 构 
数量 ， 在 第 二 个 因子 上 载荷 较 大 ， 可 以 将 其 命名 为 社会 发 展 因子 。 
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FAC11 FAC2 1 
成 分 得 分 系数 征 阵 1.96910 rr 
成 分 114186 -89127 
dl 0 -37845 1.02985 
人 为 GDP 四 .363 -.075 -66019 -33339 
因 定 资产 投资 037 324 -68292 -.39781 
社会 消费 品 零售 总 额 .332 -.058 11773 1.29606 
农村 人 均 纯 收入 .350 -026 -35673 -28068 
科研 机 构 数量 -.030 396 -26411 -22116 
卫生 机 构 数 量 -.152 446 3.44260 .31939 
提取 方法 ， 主 成 分 分 析 法 。 39444 1.79597 
旋转 方法 ; 凯撒 正 态 化 最 大 方差 法 。 
组 件 得 分 。 1.23631 .04241 
图 13-17 ”成 分 得 分 系数 矩阵 13-18 ”因子 得 分 数据 


13.2 ” 主 成 分 分 析 


主 成 分 分 析 也 称 主 分 量 分 析 ， 旨 在 利用 降 维 的 思想 把 多 指标 转化 为 少数 几 个 综合 指标 。 


13.2.1 主 成 分 分 析 的 原理 


主 成 分 分 析 是 将 多 个 变量 通过 线性 变换 以 选 出 较 少 重要 变量 的 一 种 多 元 统计 分 析 方 法 。 主 
成 分 分 析 的 思想 是 将 原来 众多 具有 一 定 相关 性 的 变量 ,重新 组 合成 一 组 新 的 互相 无 关 的 综合 指 
标 来 代替 原来 的 指标 。 它 借助 于 一 个 正 交 变 换 , 将 其 分 量 相关 的 原 随机 向 量 转化 成 其 分 量 不 相 
关 的 新 随机 向 量 , 这 在 代数 上 表现 为 将 原 随机 向 量 的 协 方差 阵 变换 成 对 角形 阵 , 在 几何 上 表现 
为 将 原 坐 标 系 变换 成 新 的 正 交 坐标 系 , 使 之 指向 样本 点 散布 最 开 的 p 个 正 交 方向 , 然后 对 多 维 
变量 系统 进行 降 维 处 理 。 方 差 较 大 的 几 个 新 变量 就 能 综合 反应 原 多 个 变量 所 包含 的 主要 信息 ， 


并 且 也 包含 了 自身 特殊 的 含义 。 主 成 分 分 析 的 数学 模型 为 : 
21 =UnX +WUX, i 


22 =UnX +upK, + +U oY, 


Zp 一 Up tuUp Ky + + Upp XY, 
其 中 ， 有 ,2，…5, 为 p 个 主 成 分 。 
主 成 分 分 析 的 基本 步骤 如 下 : 
1) 对 原 有 变量 作 坐标 变换 ， 可 得 : 
-1 三 20120 十 Molx2 十 … 十 MpiXp 
2 UM +t Up 十 … 十 MpaXp 


Fp ph tu pXy 十 十 MapXp 
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其 中 : 
2 + + =1 
var(s) =U? D0) =UDOOU, 
cov(s,,2)) =UD(OU, 
2) 提取 主 成 分 
21 称 为 第 一 主 成 分 ， 其 满足 条 件 : 
ui =1 
Var(=) = max var(u'x) 
zz 成 为 第 二 主 成 分 ， 其 满足 条 件 : 
cov(z1,22)=0 
usu, =1 
Var(z,)= max var(UX) 


其 余 主 成 分 所 满足 的 条 件 依 此 类 推 。 


13.2.2 ” 主 成 分 分 析 的 SPSS 操作 


在 SPSS 24.0 中 ， 由 于 主 成 分 分 析 模 块 被 有 机 地 嵌入 了 因子 分 析 模 块 中 ， 因 此 主 成 分 分 析 
必须 利用 因子 分 析 的 结果 才能 实现 。 本 节 对 主 成 分 分 析 的 SPSS 操作 结合 13.1 节 中 的 因子 分 析 
进行 讲解 。 

1. 进行 因子 分 析 


在 菜单 栏 中 选择 “分 析 ”|“ 降 维 ”|“ 因 子 分析 ” 命 令 ， 打 开 “ 因 子 分 析 ” 对 话 框 ， 将 需 
要 进行 主 成 分 分 析 的 变量 选 入 “变量 ”列表 框 中 ， 其 他 设置 保持 默认 ， 单 击 “ 确 定 ” 按 钮 ， 在 
SPSS Statistics 查看 器 窗口 中 得 到 如 图 13-12 和 13-14 所 示 的 因子 分 析 结 果 。 


2. 计算 特征 向 量 矩 阵 


因子 分 析 结果 中 的 主因 子 数 目 决 定 了 主 成 分 分 
析 中 主 成 分 的 数目 。 

1) 在 SPSS 中 新 建 一 个 数据 文件 , 确定 第 一 步 因 
子 分 析 “ 成 分 矩阵 ”中 得 到 的 主因 子 数目 ， 在 新 数据 
文件 中 定义 相同 数量 的 新 变量 (如 “V1”“V2”) ， 
然后 将 所 得 “成 分 矩阵 ”中 的 因子 载荷 分 别 输入 新 数 
据 文件 定义 的 新 变量 中 ， 如 图 13-19 所 示 。 图 13-19 按 因子 结果 定义 的 新 变量 

2) 在 新 数据 文件 的 数据 编辑 器 窗口 选择 “转换 ”|“ 计 算 变量 ”命令 ， 打 开 如 图 13-20 所 
示 的 “计算 变量 ”对 话 框 。 

在 “目标 变量 ”中 输入 要 定义 的 特征 向 量 的 名 称 〈 如 “F1”) ， 然 后 在 “数字 表达 式 ” 
中 输入 : “新 数据 文件 中 定义 的 新 变量 名 称 /SQRT (第 一 步 因子 分 析 中 相应 主因 子 的 初始 特征 
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值 ) ”， 如 输入 V1/SQRT(3.327)。 最 后 单 击 “ 确 定 ”按钮 ， 即 可 在 新 数据 文件 的 数据 编辑 器 
窗口 得 到 一 个 特征 向 量 。 一般 有 几 个 主因 子 就 要 定义 几 个 特征 变量 , 最 终 得 到 如 图 13-21 所 示 
的 特征 向 量 和 矩阵 。 


13-20 “计算 变量 ”对 话 框 
3. 计算 主 成 分 矩阵 


1) 对 第 一 步 中 参与 因子 分 析 的 原始 变量 进行 标准 化 ， 在 原 数 据 文件 数据 编辑 器 窗口 中 ， 
依次 选择 “分 析 ”|“ 描 述 统计 ”|“ 描 述 ” 命 令 ， 打 开 如 图 13-22 所 示 的 “描述 ”对 话 框 ， 然 
后 将 参与 因子 分 析 的 原始 变量 都 选 入 “变量 ”列表 框 中 ， 并 选中 “将 标准 化 值 另存 为 变量 ” 复 
选 框 ， 最 后 单 击 “ 确 定 ”按钮 就 可 以 得 到 如 图 13-23 所 示 的 标准 化 变量 。 


起 撞 述 
F1 F2 
456 -.269 
401 .236 
428 -236 
.490 -222 
0 有 辐 将 标准 化 信 咖 存 为 赤 量 局) 
-253 441 
图 13-21 特征 向 量 和 矩阵 图 13-22 “描述 ”对 话 框 


2) 从 特征 向 量 和 矩阵 可 以 得 到 主 成 分 的 计算 公式 : 
=1 =0.46x, + 0.4x, + 0.43xs + 0.49x, + 0.38xs +0.25xs 
= =-0.37m +0.32x, -0.32x 一 0.3x +0.45xs + 0.60xs 


其 中 ， 上 式 中 的 x 为 因子 分 析 中 的 原始 变量 标准 化 后 的 变量 ，s; 为 主 成 分 。 在 数据 编辑 器 
窗口 选择 “转换 ”|“ 计 算 变 量 ” 命 令 ， 打 开 如 图 13-20 所 示 的 “计算 变量 ”对 话 框 ,在 “ 目 
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标 变量 ”和 “数字 表达 式 ”文本 框 中 依次 输入 上 述 公 式 ， 分 别 单 击 “ 确 定 ” 按 钮 ， 就 可 以 得 到 
主 成 分 分 析 的 结果 。 


| zz 均 GDP ”| Zz 固定 资产 投资 | 2 社会 消费 品 委 售 总 额 | Z 农 村 人 均 纯 收 入 | Z 科 研 机 构 数量 | Z 卫 生机 构 数量 | 


2.04441 -.51660 1.65906 1.94024 1.62927 -42520 
1.31636 -03023 -55226 -90174 -.86049 -.90926 
-34281 -88480 -.30199 -.03634 -61073 1.02481 
-.53582 -.42228 -.82403 -.62359 -.57756 --16119 
-.46860 -19082 -1.19862 -.62105 -.97366 -.43612 
.60217 2.26560 -.48420 -07552 1.40293 -05641 
-22950 -.58107 -.93505 -11133 -38439 -.71569 
.02139 -01172 -.76471 -08823 -10146 -30704 
3.75590 2.41216 2.46924 3.23931 .49756 -.33483 
.49197 1.58117 -30226 -96530 1.74244 1.50888 


13-23 ”标准 化 后 的 变量 


13.2.3 ”实验 操作 
下 面 将 以 数据 文件 “13-1” 为 例 ， 讲 解 主 成 分 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 
1. 实验 数据 描述 


由 于 本 实验 操作 继续 利用 数据 文件 “13-1”， 因 此 数据 文件 “13-1” 的 具体 介绍 参见 13.1 
节 ， 这 里 不 再 更 述 。 


2. 实验 操作 步骤 


实验 的 具体 操作 步骤 如 下 : 


(on 打开 数据 文件 “13-1”， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 降 维 ”| “因子” 命令 ， 在 打开 的 “因子 分 析 ” 对 话 中 将 “人 均 GDP”“ 固 定 
资产 投资 ”““ 社 会 消费 品 零 售 总 额 ”““ 农 村 人 均 纯 收入 ”“ 科 研 机 构 数量 ”和 “卫生 机 
构 数量 ”变量 选 入 “变量 ”列表 框 中 。 

GE362 单 击 “ 确 定 ”按钮 ，SPSS Statistics 查看 器 窗口 输出 结果 如 图 13-12 和 图 13-14。。 

GE563 重新 建立 一 个 数据 文件 “13-2”， 在 “13-2” 中 定义 两 个 新 变量 “V1” 和 “V2”， 并 
在 数据 编辑 窗口 将 图 13-14 中 成 分 矩阵 中 的 因子 载荷 分 别 输入 “13-2” 数 据 文 件 的 
“V1” 和 “V2” 变 量 中 。 

6 本 1 在 “13-2” 数 据 文件 的 数据 编辑 器 窗口 中 选择 “转换 ” |“ 计算 变量 ”命令 ， 打 开 “ 计 
算 变量 ”对 话 框 ， 在 “目标 变量 ”文本 框 中 输入 “F1”， 然 后 在 “数字 表达 式 ” 中 输 
入 “v1/SQRT(3.327)”， 最 后 单 击 “ 确 定 ” 按 钮 。 按 此 步骤 ， 依次 完成 变量 “F2”“F3” 
的 计算 ， 就 会 得 到 特征 向 量 矩 阵 。 

GE505 在 “13-1” 数 据 编辑 器 窗口 ， 对 “人 均 GDP”“ 固 定 资产 投资 *"“ 社 会 消费 品 零售 总 
额 ”“ 农 村 人 均 纯 收入 ”“ 科 研 机 构 数量 ”和 “卫生 机 构 数量 ”变量 进行 标准 化 。 

GES365 在 “13-1” 数 据 文件 的 数据 编辑 器 窗口 中 选择 “转换 ”| “计算 变量 ”命令 ， 打 开 “ 计 
算 变 量 ” 对 话 框 ， 在 对 话 框 中 依次 输入 等 式 。 
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= =0.46= 人 均 GDP +0.4z 固 定 资产 投资 +0.43z 社 会 消费 品 零售 总 额 
+0.49z 农 村 人 均 纯 收入 +0.38= 科 研 机 构 数量 + 0.25z 卫 生机 构 数量 

==-0.37= 人 均 GDP+0.32z 固 定 资产 投资 - 0.32z 社 会 消费 品 零售 总 额 
一 0.3z 农 村 人 均 纯 收入 +0.45= 科 研 机 构 数量 +0.60z 卫 生机 构 数量 


分 别 单 击 “ 确 定 ”按钮 | 
3. 实验 结果 分 析 2 了 

74 -1.86 

单 击 “确定 ”按钮 ， 在 SPSS 数据 编辑 器 窗口 就 可 以 得 到 如 图 7 
13-24 所 示 的 两 个 主 成 分 变量 。 i 和 
图 13-24 给 出 了 由 因子 分 析 结 果 计 算出 来 的 两 个 主 成 分 变量 。 156 130 

图 中 的 每 个 主 成 分 变量 都 是 原始 变量 标准 化 后 的 线性 组 合 , 并 且 每 -3 -02 
个 主 成 分 变量 与 其 他 主 成 分 变量 无 相关 性 , 其 中 第 一 主 成 分 解释 的 i 过 
方差 比率 最 大 。 但 是 由 于 主 成 分 变量 都 是 所 有 原始 变量 的 线性 组 2.50 1.63 


合 ， 所 以 很 难 定义 每 个 主 成 分 的 具体 合 义 ， 只 能 达到 降 维 的 效果 ， 图 13.24 主 成 分 变量 


这 是 其 相对 于 因子 分 析 的 劣势 。 
13.3 上 机 题 


视频 文件 ，\video\ 上 机 题 教学 视频 \chap13.wmv 


视频 文件 ，\sample\ 上 机 题 \chap13\... 


13.1 题目 中 数据 是 34 名 运动 员 十 项 全 能 的 比赛 成 绩 。 试 采用 因子 分 析 的 方法 来 提取 公 
共 因 子 ， 分 析 衡 量 运 动员 运动 成 绩 的 指标 。 部 分 指标 数据 如 下 表 所 示 数据 路 径 ， 视频 文件 
\sample\ 上 机 题 \chap13\ 习 题 \ 第 13 章 第 一 题 .sav) 。 


100 米 〈 秒 ) 铅球 〈 米 ) 跳高 ( 米 ) 200 米 〈 秒 ) 
11.25 15.48 2.27 11.25 
10.87 14.97 1.97 10.87 
11.18 14.20 1.97 11.18 
10.62 15.02 2.03 10.62 
11.02 12.92 1.97 11.02 
10.83 13.58 212 10.83 
11.18 14.12 2.06 11.18 
11.05 15.34 2.00 11.05 
11.15 14.52 2.03 11.15 
11.23 525 1.97 地 23 
10.94 15.34 1.97 10.94 
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( 续 表 ) 
100 米 ( 秒 ) 跳远 ( 米 ) 铅球 ( 米 ) 高 ( 米 ) ; 200 米 ( 秒 ) 
11.18 734 14.48 1.94 11.18 
11.02 | 729 12.92 2.06 | 11.02 
10.99 | 737 13.61 1.97 | 10.99 
11.03 7.45 14.20 1.97 11.03 
(1) 进行 KMO 和 巴特 利 特 的 检验 ， 判 断 是 否 适合 因子 分 析 。 


(2) 计算 每 个 变量 共同 度 和 因子 贡献 率 指标 。 

(3) 采用 主 成 分 分 析 方法 计算 公共 因子 ， 同 时 绘制 

13.2 
的 指标 来 对 人 参 进行 分 级 。 试 采用 主 成 分 分 析 方 法 ， 提 


各 个 因子 的 碎 石 图 。 


为 了 确定 人 参 的 品级 ， 选 取 了 8 个 样本 观测 6 种 有 效 成 分 的 含量 ， 我 们 希望 用 较 少 


取 恰 当 数 量 的 主 成 分 进行 降 维 。 部 分 


指标 数据 如 下 表 所 示 (数据 路 径 : 视频 文件 sample\ 上 机 题 \chap13\ 习 题 \ 第 13 章 第 二 题 .sav) 


o 


有 机 酸 维生素 糖 类 元 机 盐 人 参 多 苷 
(%) (%) (%) (%) (%) 
0.056 0.084 0.031 0.038 0.056 
0.049 0.055 0.100 0.110 0.049 
0.038 0.130 0.079 0.170 0.038 
0.034 0.095 0.058 0.160 0.034 
0.084 0.066 0.029 0.320 0.084 
0.064 0.072 0.100 0.210 0.064 
0.048 0.089 0.062 0.260 0.048 
0.069 0.087 0.027 0.250 0.069 


(1) 进行 KMO 和 巴特 利 特 的 检验 ， 判 断 是 否 适合 


主 成 分 分 析 。 


(2) 采用 主 成 分 分 析 方 法 ， 提 取 主 成 分 达到 降 维 的 目的 。 
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对 应 分 析 也 称 关 联 分 析 、R-Q 型 因子 分 析 , 通过 分 析 由 定性 变量 构成 的 交互 汇总 表 来 揭示 
变量 间 的 联系 。 对 应 分 析 可 以 揭示 同一 变量 的 各 个 类 别 之 间 的 差异 , 以 及 不 同 变量 各 个 类 别 之 
间 的 对 应 关系 。 它 最 大 特点 是 能 把 样品 和 变量 同时 做 到 同一 张 图 解 上 , 将 样品 的 大 类 及 其 属性 
在 图 上 直观 而 又 明了 地 表示 出 来 。 另外， 对 应 分 析 无 须 进行 因子 选择 和 因子 轴 旋 转 ， 可 以 从 因 
子 载荷 图 上 对 样品 进行 直观 分 类 ， 而 且 能 够 指示 分 类 的 主要 参数 〈 主 因子 ) 以 及 分 类 的 依据 ， 
在 变量 个 数 与 变量 的 取 值 类 别 较 多 的 时 候 具 有 明显 的 优势 。 对 应 分 析 在 市 场 细 分 、 产 品 定位 、 
企业 管理 等 领域 中 具有 广泛 的 应 用 。 


14.1 一 般 对 应 分 析 


对 应 分 析 法 是 在 R 型 和 Q 型 因子 分 析 的 基础 上 发 展 起 来 的 一 种 多 元 统计 分 析 方法 ， 因 此 
对 应 分 析 又 称 为 R-Q 型 因子 分 析 。 


14.1.1 一 般 对 应 分 析 的 基本 原理 


由 于 指标 型 的 因子 分 析 和 样品 型 的 因子 分 析 反 映 的 是 一 个 整体 的 不 同 侧面 ,因此 它们 之 间 
一 定 存 在 内 在 的 联系 。 如 果 能 够 有 效 利用 这 种 内 在 联系 所 提供 的 信息 , 对 更 全 面 合理 地 分 析 数 
据 具有 很 大 的 帮助 。 在 因子 分 析 中 ， 如 果 研 究 的 对 象 是 样品 ， 可 采用 Q 型 因子 分 析 ; 如 果 研 
究 的 对 象 是 变量 ， 则 需 采 用 R 型 因子 分 析 。 但 是 ， 因 为 这 两 种 因子 分 析 方法 必须 分 别 对 样品 
和 变量 进行 处 理 , 所 以 这 两 种 分 析 方 法 往往 存在 着 相互 对 立 的 关系 , 为 我 们 发 现 和 寻找 它们 的 
内 在 联系 制造 了 困难 。 而 对 应 分 析 通 过 一 个 过 渡 和 矩阵 乙 将 两 者 有 机 地 结合 了 起 来 。 

对 应 分 析 的 基本 思想 是 将 一 个 联 列表 的 行 和 列 中 各 元 素 的 比例 结构 , 以 点 的 形式 在 较 低 维 
的 空间 中 表示 出 来 。 首 先 ， 给 出 指标 变量 点 的 协 差 阵 A=Z，Z 和 样品 点 的 协 差 阵 B=ZZ”， 由 
于 两 者 有 相同 的 非 零 特征 根 , 所 以 可 以 很 方便 地 借助 指标 型 因子 分 析 而 得 到 样品 型 因子 分 析 的 
结论 。 如 果 对 每 组 变量 选择 前 两 列 因子 载荷 ,那么 两 组 变量 就 可 以 画 出 两 个 因子 载荷 的 散 点 图 。 
由 于 这 两 个 图 所 表示 的 载荷 可 以 配对 ,于 是 就 可 以 把 这 两 个 因子 载荷 的 两 个 散 点 图 画 到 同一 张 
图 中 ， 并 以 此 来 直观 地 显示 各 行 变 量 和 各 列 变量 之 间 的 关系 。 


14.1.2 一 般 对 应 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
进行 对 应 分 析 。 
1) 在 菜单 栏 中 选择 “分 析 ”|“ 降 维 ”|“ 对 应 分 析 ” 命 令 ， 打 开 如 图 14-1 所 示 的 “对 应 
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2) 选择 变量 。 

Q@@“ 行 ”列表 框 。 该 列表 框 中 的 变量 是 进行 对 应 分 析 的 行 变量 ， 且 必须 是 数值 型 的 名 义 
变量 , 因此 必须 将 分 类 字符 串 变 量 重新 编码 为 数值 型 变量 的 名 义 变 量 。 另外 ,对 于 汇总 数据 要 
使 用 具有 正 相似 性 值 的 加 权 变量 。 

@@ “ 列 ” 列 表 框 。 该 列表 框 中 的 变量 是 进行 对 应 分 析 的 列 变量 ， 同 行 变 量 一 样 都 必须 是 
数值 型 的 名 义 变量 。 

3) 进行 相应 的 设置 。 

“定义 范围 ”设置 

一 旦 选 定 行 变量 或 列 变量 ，“ 定 义 范围 ”按钮 就 会 被 激活 。 以 列 变量 为 例 ， 单 击 “ 列 ” 列 
表 框 下 方 的 “定义 范围 ”按钮 ， 弹 出 如 图 14-2 所 示 的 “对 应 分 析 : 定义 列 范围 ”对 话 框 。 


起 对 现 分 析 : 定义 列 殉 转 贡 
列 变 量 的 类 别克 国 : 吸烟 
:| | 一 一 
axw [一] 加 加 
类 别 约束 

加 无 

日 类 别 必须 由 等 (C) 

日 类 别 为 补充 性 (@) 

EE TE 
图 14-1 “对 应 分 析 ” 对 话 框 图 14-2 “对 应 分 析 : 定义 列 范围 ”对 话 框 


“对 应 分 析 : 定义 列 范围 "对话 框 主要 用 于 对 行 变量 定义 范围 , 该 对 话 框 含有 两 个 选项 组 。 

Q@ “ 列 变量 的 类 别 范围 吸烟” 选项 组 。 在 该 选项 组 的 “最 小 值 ”文本 框 中 输入 列 变量 
的 最 小 整数 值 ， 在 “最 大 值 ”文本 框 中 输入 列 变量 的 最 大 整数 值 。 其 中 ， 指 定 的 最 小 值 和 最 大 
值 必须 为 整数 ， 小 数 数 据 值 会 在 分 析 中 被 截断 ， 指 定 范围 之 外 的 类 别 值 将 不 参与 对 应 分 析 。 设 
置 完毕 后 ， 单 击 “ 更 新 ”按钮 ， 就 可 以 完成 列 变量 的 范围 设置 。 

@ “类 别 约束 ”选项 组 。 该 选项 组 用 于 当 分 类 所 代表 的 分 类 不 符合 对 应 分 析 的 需要 ， 或 
者 分 类 模糊 时 对 取 值 设 置 约束 条 件 , 如 将 某 个 列 类 别 约束 为 等 于 其 他 列 类 别 , 或 者 将 列 类 别 定 
义 为 补充 类 别 。 


。 无 : 表示 不 进行 任何 约束 . 

。 类 别 必 须 相 等 : 表示 列 类 别 必 须 具有 相等 的 得 分 。 如 果 所 获得 的 类 别 顺序 不 理想 或 不 直观 ， 
请 使 用 等 同性 约束 。 可 约束 为 相等 的 列 类 别 的 最 大 数量 等 于 活动 列 类 别 总 数 减 1。 

。 类 别 为 补充 性 : 表示 补充 类 别 不 影响 分 析 ， 但 会 出 现在 由 活动 类 别 定义 的 空间 中 ， 该 类 别 
对 定义 维 不 起 作用 ， 最 大 数目 为 列 类 别 总 数 减 2。 

“模型 ”设置 

单 击 “ 模 型 ”按钮 ， 弹 出 如 图 14-3 所 示 的 “对 应 分 析 : 模型 ”对 话 框 。 
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“对 应 分 析 : 模型 ”对 话 框 主要 用 于 指定 维 数 、 距 离 
测量 、 标 准 化 方法 及 正 态 化 方法 。 


中 “ 解 中 的 维 数 ” 文本 框 。 该 文本 框 主要 用 于 指定 对 
应 分 析 的 维 数 。 对 应 分 析 的 目的 要 求 根据 需要 选择 尽量 少 
的 维 数 来 解释 大 多 数 变 异 。 最 大 维 数 取决 于 分 析 中 使 用 的 
活动 类 别 数 以 及 相等 性 约束 的 数目 。 一 般 情况 下 ， 所 能 够 
设置 的 最 大 维 数 取 决 于 以 下 两 项 中 的 较 小 者 : 活动 行 类 别 
数 减 去 约束 为 相等 的 行 类 别 数 ， 加 上 受 约束 的 行 类 别 集 的 


正 态 化 方法 


数目 ;活动 列 类 别 数 减 去 约束 为 相等 的 列 类 别 数 ， 加 上 受 国 对 和 和 (8) 昌 行 主 夺 分 N) 口 定制 (Q) 


约束 的 列 类 别 集 的 数目 。 ER 四 OR 
@@ “距离 测量 ”选项 组 。 该 选项 组 主要 用 于 对 应 表 的 (me) Com) Ce 
行 和 列 之 间距 离 的 测量 。 14.3 “对 应 分 析 : 模型” 对话 杠 


。 卡 方 : 该 单 选 按钮 表示 卡 方 距离 测度 ， 即 使 用 加 权 轮 廊 表 距离 ， 是 标准 对 应 分 析 中 所 必需 
的 ， 其 中 权重 是 行 或 列 的 质量 。 
。 欧 氏 : 该 单 选 按钮 表示 欧 几 里 得 距离 测度 ， 即 使 用 行 对 和 列 对 之 间 平 方差 之 和 的 平方 根 进 


行 测度 。 

@ “标准 化 方法 ”选项 组 。 该 选项 组 主要 用 于 选择 数据 标准 化 的 方法 ， 各 选项 介绍 如 表 

14-1 所 示 。 
表 14-1 “标准 化 方法 ”选项 组 选项 介绍 
选项 含义 及 其 他 

二 表示 行 和 列 都 被 中 心 化 ， 适 用 于 标准 对 应 分 析 ， 仅 在 选择 “ 卡 方 ”距离 
除去 行列 平均 值 测量 时 可 用 
除去 行 平均 值 表示 只 有 行 被 中 心 化 处 理 
除去 列 平均 值 表示 只 有 列 被 中 心 化 处 理 
使 行 总 计 相等 ， 并 除去 平均 值 | 表示 在 行 数据 中 心 化 之 前 先 使 行 边际 相等 
使 列 总 计 相等 ， 并 除去 平均 值 | 表示 在 列 数 据 中 心 化 之 前 先 使 列 边际 相等 


其 中 ，“ 除 去 行 平均 值 ”“ 除 去 列 平均 值 ”“ 使 行 总 计 相等 ， 并 除去 平均 值 ” 和 “使 列 总 
计 相 等 ， 并 除去 平均 值 ” 仅 在 选择 “ 欧 氏 ”距离 测量 时 可 用 。 
由“ 正 态 化 方法 ”选项 组 。 该 选项 组 主要 用 于 设置 数据 正 态 化 方法 , 各 选项 介绍 如 表 14-2 


所 示 。 
表 14-2 “ 正 态 化 方法 ”选项 组 选项 介绍 
选项 含义 及 其 他 

表示 对 于 每 个 维 ， 行 得 分 为 列 得 分 的 加 权 平均 值 除 以 对 应 的 奇异 值 ， 列 得 分 为 行 得 分 的 加 

对 称 权 平均 值 除 以 对 应 的 奇异 值 ， 如 果 想 要 检查 两 个 变量 的 类 别 之 间 的 差异 或 相似 性 ， 则 使 用 
此 方法 

主 大 分 表示 行 点 和 列 点 之 间 的 距离 是 对 应 于 所 选 距离 测量 的 近似 值 ， 当 需要 检查 一 个 或 两 个 变量 
类 别 之 间 的 差异 而 非 两 个 变量 之 间 的 差异 时 选中 该 单 选 按钮 
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( 续 表 ) 


选项 含义 及 其 他 


表示 行 点 之 间 的 距离 是 对 应 于 所 选 距 离 测量 的 近似 值 ， 行 得 分 是 列 得 分 的 加 权 平 均值 ， 特 


wig 别 是 当 要 检验 行 变量 类 别 之 间 的 差异 或 相似 性 时 选中 该 单 选 按钮 


表示 列 点 之 间 的 距离 是 对 应 于 所 选 距离 测量 的 近似 值 ， 列 得 分 是 行 得 分 的 加 权 平 均值 ， 特 


的 别 是 检查 列 变量 类 别 之 间 的 差异 或 相似 性 时 选中 该 单 选 按钮 


表示 用 户 自己 指定 介 于 -1 和 1 之 间 的 值 ，“-1” 相 当 于 “主要 列 ”“1” 相 当 于 “主要 行 ” 


| “0” 相 当 于 “对 称 ”， 而 其 他 值 不 同 程度 地 将 “惯量 ”分 布 于 行 得 分 和 列 得 分 上 


“统计 ”设置 
单 击 “ 统 计 ” 按 钮 ， 弹 出 如 图 14-4 所 示 的 “对 应 分 析 : 统计 ”对 话 框 。 
“对 应 分 析 : 统计 ”对 话 框 主要 用 于 设置 输出 对 应 分 析 的 统计 量 值 ， 包 括 : 


。 “对 应 表 ” 复 选 框 : 该 复 选 框 用 于 指定 输出 行 、 列 各 个 类 别 组 合 的 交叉 表 信息 。 
“ 行 点 概述 ” 复 选 框 : 该 复 选 框 用 于 指定 输出 每 个 行 类 别 的 得 分 、 质 量 、 惯 量 、 点 对 维 惯 
量 的 贡献 和 维 对 点 惯量 的 贡献 。 
。 “ 列 点 概述 ” 复 选 框 : 该 复 选 杠 用 于 指定 输出 每 个 列 类 别 的 得 分 、 质 量 、 惯量、 点 对 维 惯 
量 的 贡献 和 维 对 点 惯量 的 贡献 。 
。 “对 应 表 的 排列 ” 复 选 框 : 该 复 选 框 用 于 指定 输出 排列 后 的 对 应 表 ， 即 输出 根据 第 一 维 上 
的 得 分 按 递增 顺序 排列 行 和 列 的 对 应 表 。 可 在 “最 大 排列 维 数 ”文本 框 中 输入 置换 表 的 最 
大 维 数 ， 从 而 为 从 1 到 指定 数字 的 每 一 维 分 别 生成 一 个 置换 表 。 
。 “ 行 概要 ” 复 选 框 : 该 复 选 框 用 于 指定 输出 每 个 行 变 量 类 别 对 所 有 列 变量 类 别 的 分 布 。 
。 “ 列 概要 ” 复 选 框 : 该 复 选 框 用 于 指定 输出 每 个 列 变量 类 别 对 所 有 行 变量 类 别 的 分 布 。 
e “以 下 对 象 的 置信 度 统 计 ” 选 项 组 : 该 选项 组 主要 用 于 设置 输出 非 补充 行 或 列 点 的 标准 差 
和 相关 性 。“ 行 点 ” 单 选 按钮 表示 输出 行 点 的 标准 差 和 相关 性 。“ 列 点 ” 单 选 按钮 表示 输 
出 列 点 的 标准 差 和 相关 性 。 
“图 ”按钮 
单 击 “ 图 ”按钮 , 弹出 如 图 14-5 所 示 的 “对 应 分 析 : 
图 ”对 话 框 。 
由 对 应 分 析 :统计 区 
辐 罗 应 Cj 
国 行 点 概述 (R) 
网 列 点 概述 (L) 
回 对 应 表 的 排列 P) 
最 大 排列 维 数 岂 
加 行 概要 (O) 
口 有 更 山 


以 下 对 象 的 置信 和 度 统计 : 
器 行 点 W 器 列 点 ) 


JIE IE 且 
图 14-4 “对 应 分 析 : 统计 ”对 话 框 图 14-5 “对 应 分 析 图 ”对 话 框 
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“对 应 分 析 : 图 ”对 话 框 主要 用 于 对 输出 图 形 进行 设置 。 

四 “ 散 点 图 ”选项 组 。 该 选项 组 主要 用 于 输出 维 的 所 有 成 对 图 矩阵 。 

。 双 标 图 : 该 复 选 框 表示 输出 行 点 和 列 点 的 联合 图 矩阵 。 

。 行 点 : 该 复 选 框 表示 输出 行 点 图 矩阵 。 

。 列 点 : 该 复 选 框 表示 输出 列 点 图 和 矩阵。 在“ 散 点 图 的 ID 标签 宽度 ”中 输入 散 点 图 标签 字 
符 个 数 ， 该 值 必须 为 小 于 或 等 于 20 的 非 负 整数 。 

@ “折线 图 ”选项 组 。 该 选项 组 主要 用 于 为 指定 变量 的 每 一 维 生 成 一 个 线 图 。 

。 转换 后 行 类 别 : 该 复 选 框 表示 输出 以 行 类 别 初始 值 对 行 类 别 生 成 的 得 分 图 。 

。 转换 后 列 类 别 : 该 复 选 框 表示 输出 以 列 类 别 初始 值 对 列 类 别 生 成 的 得 分 图 。 

@ “图 维 ” 选 项 组 。 该 选项 组 主要 用 于 设置 图 的 维 数 。 

。 显示 解 中 所 有 的 维 : 该 单 选 按钮 表示 行 和 列 的 维 数 显示 在 交叉 表 中 。 

。 限制 维 数 : 该 单 选 按钮 表示 限制 输出 的 维 数 ， 在 “最 低 维 ”中 输入 从 1 到 总 维 数 减 1 的 整 
数 ， 在 “最 高 维 ” 中 输入 从 2 到 总 维 数 的 整数 。 


4) 分 析 结 果 输 出 。 
设置 完毕 后 , 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 对 应 分 析 的 结果 。 


14.1.3 ”实验 操作 
下 面 将 以 “14-1” 数 据 文件 为 例 ， 讲 解 对 应 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 


1. 实验 数据 描述 


“14-1” 数据 文件 由 按 工作 类 别 区 分 吸烟 行为 的 交叉 制 
表 构成。 变量 “人 员 组 ”包含 工作 类 别 高 级 经 理 、 初 级 经 理 、 
高 级 雇员 、 低 级 雇员 和 秘书 以 及 类 别 国家 平均 水 平 ( 可 用 作 
分 析 的 补充 ) ;变量 “吸烟 ”包含 行为 不 吸烟 、 少 量 、 中 竺 
数量 和 大 量 以 及 类 别 不 饮酒 和 人 饮酒 (这些 类 别 可 用 作 分 析 的 
补充 ) ， 变量“ 权重” 是 对 该 类 别 的 数目 的 描述 。 本 实验 将 
利用 对 应 分 析 方法 来 对 “人 员 组 ”和 “吸烟 ”两 个 分 类 变量 
的 对 应 关系 进行 分 析 。 原 始 Excel 数据 文件 如 图 14-6 所 示 。 

首先 在 SPSS 变量 视图 中 建立 变量 “人 员 组 ”“ 吸 烟 ” 
和 “计数 ”， 分 别 表示 工作 类 别 、 吸 烟 状况 和 数据 的 权重 。 
“人 员 组 ”为 名 义 变量 ， 分 别 将 “高 级 经 理 ”“ 初 级 经 理 ” 
“高 级 雇员 ”“ 低 级 雇员 ”和 “秘书 ”以 及 类 别 国家 平均 水 
平 赋值 为 “1”“2”“3”“4”“5”“6”。“ 吸 烟 ” 也 为 
名 义 变量 ， 分 别 将 “不 吸烟 ” “少量 ”“ 中 等 数量 ”和 “大 
量 ”以 及 类 别 “ 不 饮酒 ”和 “饮酒 ”赋值 为 “1”“2”“3” 
4 6 训 图 11427 所 过 。 


民间 


10 


14-6 “14-1” 数 据 文件 原始 数据 
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CE = 


| 到 | 对齐 | 到 
(100. 融 扫 、 无 8 再 右 有 
0. 和- 无 8 潭 有 
本 无 8 性 右 少 生 度 


BM SPSS Stalistics 处 于 程序 外 幸 。。 Unicode ON | 机 重 开 让 
图 14-7 “14-1” 数 据 文件 的 变量 视图 


然后 在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 
部 分 数据 如 图 14-8 所 示 。 


图 14-8 “14-1” 数 据 文件 的 数据 视图 
2. 实验 操作 步骤 
有 具体 操作 步骤 如 下 : 


GES56i) 打开 “14-1” 数据 文件 , 进入 SPSS Statistics O FxH1RRO) 
数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “数据 ” 
1 “个案 加 权 ” 命 令 ， 打 开 如 图 14-9 所 示 的 
“个 案 加 权 ” 对 话 框 ， 选 中 “个 案 加 权 系 


数 ” 单 选 按钮 ， 然 后 单 击 “计数” 变量 ， St 
单 击 国 按 钮 将 其 先入 “频率 变量 ”文本 框 | 加 到 加 匡 司 让 避 
中 ， 单 击 “ 继 续 ” 按钮， 保存 设置 结果 。 a 
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GES62 在 “14-1” 数 据 文件 数据 编辑 器 窗口 的 菜单 栏 中 选择 “分 析 ” |“ 降 维 ”|“ 对 应 分 析 ” 
命令 ， 打 开 “对 应 分 析 ” 对 话 框 。 首 先 将 “人 员 组 ” 选 入 “ 行 ”列表 框 ， 单 击 “ 定 
义 范围 ”按钮 ， 打 开 “ 对 应 分 析 : 定义 行 范围 ”对 话 框 ， 在 该 对 话 框 的 “最 小 值 ” 
和 “最 大 值 ” 文 本 框 中 分 别 输入 1 和 5, 单 击 “ 更 新 ”按钮 。 然 后 将 “ 豚 烟 " 选 入 “ 列 ” 
列表 框 ， 单 击 “ 定 义 范围 ”按钮 ， 打 开 “ 对 应 分 析 : 定义 列 范 围 ” 对 话 框 ， 在 该 对 
话 框 的 “最 小 值 ” 和 “最 大 值 ” 文 本 框 中 分 别 输入 1 和 4， 单 击 “ 更 新 ”按钮 。 

人 GE563 单 击 “ 统 计 ” 按 钮 ， 打 开 “ 对 应 分 析 : 统计 ”对 话 框 ， 选 中 “对 应 表 的 排列 ”“ 行 概要 ” 
“ 列 概要 ”“ 行 点 ”和 “ 列 点 ” 复 选 框 ， 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 结果 。 

ES63 单 击 “ 确 定 ” 按 钮 ， 便 可 以 得 到 简单 对 应 分 析 结果 。 


3. 实验 结果 及 分 析 
SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 14-10~ 图 14-17 所 示 。 


吸烟 


人 员 纪 不 吸烟 y 草 中 等 数量 ”大量 。 | 话 动 边际 
高 级 认 负 25 10 12 4 51 
烤 书 10 6 7 2 25 
高 级 修理 4 2 3 2 11 
低级 诺 负 18 24 33 13 88 
初级 经 理 4 3 4 18 
活动 边际 61 45 62 25 193 


图 14-10 对 应 表 
图 14-10 给 出 了 对 应 分 析 的 对 应 表 。 实 际 上 ， 对 应 表 相当 于 “人 员 组 ”和 “吸烟 ”两 个 变 
量 的 交叉 表 。“ 活 动 页 边 距 ”表示 相应 行 或 列 个 案 分 布 的 总 计 。 从 该 图 可 以 发 现 ， 大 量 吸烟 的 
职员 最 少 , 而 不 吸烟 和 中 等 数量 吸烟 的 职员 最 多 。 但 是 从 该 图 还 不 能 看 出 是 否 吸 烟 和 工作 类 别 


之 间 的 关系 。 
摘要 
企业 比例 置信 应 奇 状 值 
相关 性 
扒 掉 值 偶 量 卡 方 中 时 和 标 六 2 
1 273 075 878 878 ‘070 020 
区 es 100 010 118 995 076 

3 020 000 005 1.000 
总 计 .085 16.442 1722 1.000 1.000 


3.12 自由 度 
图 14-11 摘要 输出 表 
14-11 给 出 了 对 应 分 析 的 统计 摘要 表 。 对 应 分 析 的 目的 是 利用 尽 可 能 少 的 维度 表示 变量 
间 的 关系 , 而 摘要 表 可 以 提供 最 大 维度 的 信息 来 观察 每 个 维度 上 的 贡献 。 在 本 实验 中 最 大 维度 
是 这 样 确定 的 : 活动 列 变量 类 别 数 〈 四 类 ) 减 去 1， 即 为 三 个 维度 。“ 惯 量 比例 ”相当 于 特征 
值 , 是 衡量 解释 数据 变异 能 力 的 指标 。 可 见 第 一 维度 展示 了 最 多 的 变异 : 0.878 (0.075/ 0.085) ， 
第 二 个 维度 与 第 一 个 维度 正 交 ， 展 示 了 剩 下 的 最 大 部 分 : 11.8% 〈0.010/0.085) ， 而 第 三 个 维 
度 解 释 能 力 几乎 没有 。 由 于 第 三 维度 仅仅 承载 了 0.5% 的 变异 ， 因 此 二 维 的 对 应 分 析 就 足够 了 。 
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“置信 度 奇异 值 ”表示 行 得 分 和 列 得 分 的 相 行 点 和 列 点 
关系 数 ， 与 皮尔 逊 相关 系数 类 似 。 它 等 于 惯  ， 对 称 正 坊 化 
量 值 的 平方 ， 因 此 是 维度 重要 性 的 另 一 种 | 
度量 。 Nm x 
图 14-12 给 出 了 行 得 分 和 列 得 分 在 二 维 。 o 
上 的 散 点 图 ， 通 过 图 表 的 形式 展现 类 别 和 样 
本 之 间 的 潜在 关系 。 行 点 和 列 点 越 近 表示 关 | ”Sasn a 
系 越 密切 。 如 第 二 个 维 数 把 经 理 和 其 他 雇员 “ a san 
分 开 了 。 对 称 正 态 化 方法 使 得 比较 容易 观察 ? 二 
“工作 组 ”和 “吸烟 ”之 间 的 关系 ， 经 理 比 as 
较 接近 大 量 吸烟 型 ， 而 高 级 雇员 更 接近 不 吸 
烟 型 。 
图 14-13 给 出 了 行 概 要 文件 表 。 每 个 单元 。“* 45 on 号 1 
格 给 出 了 相应 交叉 表 中 该 单元 格 频数 占 该 行 
个 案 总 数 的 百分比 〈 如 高 级 雇员 和 秘书 中 分 图 14-12 对 应 分 析 散 点 图 


别 有 49% 和 40% 的 不 吸烟 ， 而 初级 经 理 和 低级 雇员 中 有 近 40% 的 中 等 吸烟 ) 。“ 活 动 边际 ” 
表示 该 行 的 总 计 百 分 比 。“ 数 量 ” 表 示 该 行 个 案 数 目 占 总 个 案 数 目的 百分比 。 

图 14-14 给 出 了 列 概要 文件 表 。 每 个 单元 格 给 出 了 相应 交叉 表 中 该 单元 格 频数 占 该 列 个 案 
总 数 的 百分比 〈 如 不 吸烟 的 雇员 中 高 级 雇员 最 多 ， 占 总 数 的 41%; 而 大 量 吸烟 和 中 度 吸 烟 的 
雇员 中 低级 雇员 最 多 ) 。“ 活 动 边 际 ”表示 该 列 的 总 计 百 分 比 。“ 数 量 ” 表 示 该 列 个 案 数 目 占 
总 个 案 数 目的 百分比 。 


行 概要 列 概要 
| 吸烟 
信 员 组 上 竺 要 只 边际 人 员 组 不 吸烟 少 条 中 等 数 入 大 各 数 和 全 
高 卓 稻 再 364 182 273 182 1.000 高 级 经 理 .066 044 048 080 057 
初 经 经 理 222 167 389 222 1.000 初级 经理 .066 067 113 160 .093 
高 能 麻 员 490 196 235 .078 1.000 高 级 亡 员 .410 222 194 .160 264 
低级 麻 负 205 273 .375 .148 1.000 低级 座 员 295 .533 .532 520 456 
稻 书 400 240 280 .080 1.000 各 节 164 133 113 080 130 
数 重 316 233 .321 .130 话 动 边 际 1.000 1.000 1.000 1.000 
图 14-13 行 概要 文件 表 14-14” 列 概要 文件 表 


图 14-15 给 出 了 行 点 概述 的 信息 。“ 数 量 ”表示 该 类 别 个 案 占 总 个 案 数目 的 百分比 。“ 维 
得 分 ”表示 各 个 行 类 别 在 第 一 维度 和 第 二 维度 上 的 得 分 ， 也 是 对 应 分 析 散 点 图 的 坐标 值 ， 通 过 
该 得 分 可 以 判断 行 类 别 在 每 个 维度 上 的 分 散 情况 。“ 贡 献 ” 表 示 行 点 对 维度 或 者 维度 对 行 点 变 
异 的 解释 能 力 ( 即 惯量 的 贡献 度 ) ， 其 中 “点 对 维 的 惯量 ”表示 行 点 在 该 维度 上 的 贡献 或 者 重 
要 度 ，“ 维 对 点 的 惯量 ”表示 该 维度 对 解释 该 类 别 行 点 的 贡献 度 。 从 中 可 以 看 出 “高 级 雇员 ” 
和 “低级 雇员 ”在 第 一 维度 上 贡献 了 85% 的 惯量 ， 是 该 维度 上 的 主导 行 点 ;， “高 级 雇员 ”和 
“低级 雇员 ”的 惯量 在 第 一 维度 和 第 二 维度 上 得 到 了 全 部 的 分 散 ,并 且 前 两 维度 几乎 解释 了 “高 
级 经 理 ”89% 的 惯量 ， 因 此 第 三 维度 几乎 没有 贡献 。 
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行 点 总 览 
准 理 分 贡献 
可 淮 的 人 扒 夺 点 的 收 划 
组 数 醒 1 保 委 4 1 十 
两 线 经 理 .057 -126 61 .003 .003 14 .092 800 893 
初级 经 理 093 495 769 :012 .084 .551 526 465 991 
击 区 谨 员 .264 728 034 038 512 003 999 001 1.000 
低级 府 负 .456 446 183 026 331 15: 942 058 1.000 
_ 积 书 130 385 249 006 070 081 865 133 999 
活动 总 计 1.000 ,085 1.000 1.000 
a. 对 称 正 志 化 
图 14-15 行 点 概述 


图 14-16 和 图 14-17 给 出 了 行 点 和 列 点 的 置信 统计 量 信息 。“ 维 的 标准 差 ” 表 示 各 个 行 类 
别 或 列 类 别 在 第 一 维度 和 第 二 维度 上 的 得 分 的 标准 差 ， 如 果 标 准 差 过 大 则 对 该 行 点 或 列 点 在 
总 体 中 的 位 置 将 更 加 不 确定 ， 如 果 标 准 差 很 小 则 该 行 点 或 列 点 在 总 体 中 的 位 置 将 非常 接近 对 
应 分 析 给 出 的 点 位 置 。“ 相 关 性 ”表示 了 第 一 维度 得 分 和 第 二 维度 得 分 的 相关 性 ， 如 果 相 关 
性 很 大 则 没有 把 握 在 一 个 正确 的 维度 确定 行 点 或 列 点 的 位 置 。 如 “高 级 经 理 ” 和 “初级 经 理 
”的 标准 差 都 比较 大 ， 是 因为 这 两 个 类 别 的 个 案 数 目 比较 小 。 


置信 度 行 点 置信 度 列 点 

de 本 推 的 标准 莹 相关 性 
人 员 组 1 1 慨 册 1 1 
高 级 公理 614 917 101 EE 
各 如 三 而 二 不 吸烟 118 145 402 
高 级 座 员 110 157 107 少量 281 292 054 
低级 膝 员 118 124 611 中 等 数 重 179 332 020 
要 入 158 153 -360 大 重 361 441 -.155 

图 14-16 置信 度 行 点 图 14-17 置信 度 列 点 


14.2 多重 对 应 分 析 


与 简单 对 应 分 析 用 于 分 析 两 个 分 类 变量 间 的 关系 不 同 ,多 重 对 应 分 析 适 用 于 分 析 一 组 属性 
变量 之 间 的 相关 性 。 


14.2.1 多重 对 应 分 析 的 基本 原理 


与 一 般 对 应 分 析 一 样 ,多 重 对 应 分 析 的 基本 思想 也 是 以 点 的 形式 在 较 低 维 的 空间 表示 联 列 
表 行 和 列 中 各 元 素 的 比例 结构 。 多 重 对 应 分 析 的 计算 方法 和 计算 结果 与 一 般 对 应 分 析 基 本 相 
同 。 与 一 般 对 应 分 析 相 比 ， 多 重 对 应 分 析 的 优势 表现 在 以 下 两 个 方面 : 


(1) 可 以 同时 处 理 并 以 图 形 的 形式 表示 多 个 分 类 变量 之 间 的 关系 ; 
(2) 可 以 同时 分 析 多 种 形式 的 变量 ， 能 够 处 理 的 变量 种 类 更 加 丰富 。 


14.2.2 ”多 重 对 应 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 建立 一 个 数据 文件 后 ， 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 进 
行 多 重 对 应 分 析 。 
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1) 在 菜单 栏 中 选择 “分 析 ”|“ 降 维 ”|” 最 优 标 度 ” 命 令 ， 
打开 如 图 14-18 所 示 的 “最 优 标 度 ” 对 话 框 。 

“最 优 标 度 ” 对 话 框 用 于 设置 变量 集 数目 、 分 析 方 法 等 ， 
包括 : 


@ 最 优 标 度 级 别 。 该 选项 组 用 于 指定 变量 的 度量 类 型 。 如 
果 所 要 分 析 的 变量 都 是 名 义 变量 而 非 有 序 变量 或 度量 变量 ， 则 
选中 “所 有 变量 均 为 多 重 名 义 ” 单 选 按钮 ， 如 果 所 要 分 析 的 变 
量 含有 名 义 变量 而 非 有 序 变量 或 度量 变量 ， 则 选中 “ 某 些 变量 
并 非 多 重 名 义 ” 单 选 按钮 。 

@ 变量 集 的 数目 。 该 选项 组 用 于 确定 变量 集 的 数目 。 如 果 
仅仅 分 析 的 是 一 组 变量 间 的 关系 ， 则 选中 “一 个 集合 ” 单 选 按 ”图 1418 “最 优 标 度 ”对 话 框 
钮 ， 如 果 分 析 的 变量 中 含有 多 选 题 变量 集合 ， 则 选中 “多 个 集合 ” 单 选 按钮 。 

@ 选 定 的 分 析 。 该 选项 组 用 于 显示 最 有 刻度 的 分 析 方 法 。 当 分 析 多 个 名 义 分 类 变量 之 间 
的 关系 且 一 个 变量 集 时 则 显示 “多 重 对 应 分 析 ”, 此 时 选择 了 “所 有 变量 均 为 多 重 含义 ”" 和 “一 
个 集合 ” 单 选 按钮 ; 当 所 要 分 析 的 变量 含有 名 义 变量 而 非 有 序 变 量 或 度量 变量 且 分 析 的 变量 中 
含有 多 选 题 变量 集合 时 显示 “分 类 主要 成 分 ”， 此 时 选择 了 “ 某 些 变量 并 非 多 重 含义 ”和 “一 
个 集合 ” 单 选 按钮 ， 该 方法 多 用 于 市 场 研究 中 多 维 偏好 分 析 ; 当选 择 了 “多 个 集合 ” 单 选 按钮 
就 会 显示 “ 非 线性 典型 相关 性 ”。 

本 节 主要 介绍 “多 重 对 应 分 析 ” 方 法 ， 因 此 选择 图 14-18 所 示 的 “最 优 标 度 ” 对 话 框 中 的 
“所 有 变量 均 为 多 重 含义 ”和 “一 个 集合 ” 单 选 按钮 ， 然 后 单 击 “定义 ”按钮 ,打开 如 图 14-19 
所 示 的 “多 重 对 应 分 析 ” 对 话 框 。 


和 业者 并 非 多重 名 XS) 


变量 集 的 孝 目 
图 一 个 集 全 (0) 
日 多 个 集 M) 


| EN x 
A): Er 
PT 
二 na 碍 尖 部 中 | 
吉 记名 枯 [区] 
呈 长 肛 (以 站 页 二 计 
rn ET 
十 hreasn 人): i 
吧 头 部 肛 关 neaanl (ase 
Er Ee 
居民 部 形 区 | 
而 assn 
re 4 
长度 (以 半 黄 di 计 此 
二 BRE boroml] 
brassl 
部 肛 拓 headl 
| hh: 3 
EE re 


图 14-19 “多 重 对 应 分 析 ” 对 话 框 
2) 选择 变量 。 
@ 分 析 变 量 。 该 列表 框 中 的 变量 是 进行 多 重 对 应 分 析 的 目标 变量 ， 并 且 都 必须 是 数值 型 
的 名 义 变量 , 因此 必须 将 分 类 字符 串 变量 重新 编码 为 数值 型 变量 的 名 义 变量 。 可 以 选 入 两 个 以 
上 的 变量 , 如 果 仅 选 入 两 个 变量 相当 于 进行 简单 对 应 分 析 。 每 个 变量 必须 至 少 包含 三 个 有 效 个 
案 且 该 分 析 基 于 正 整 数 数 据 。 
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一 旦 选 定 分 析 变 量 , “定义 变量 权重 ”按钮 就 会 被 激活 。 单 击 “ 定 义 变量 权重 ”按钮 ， 弹 


权重 。 


出 如 图 14-20 所 示 的 “MCA: 定义 变量 权重 ”对 话 框 。 在 “变量 权重 ”文本 框 中 输入 变量 的 


@ 补充 变量 。 该 列表 框 中 的 变量 是 进行 多 重 对 应 分 析 的 补充 变量 , 不 用 于 多 重 对 应 分 析 ， 


仅 用 于 对 比 。 


@ 标注 变量 。 该 列表 框 中 的 变量 是 进行 多 重 对 应 分 析 的 标签 变量 ， 用 于 在 结果 中 标示 记录 。 
图 解 中 的 维 数 。 该 文本 框 用 于 输入 多 重 对 应 分 析 结 果 的 最 低 维 度数 目 。 


3) 进行 相应 的 设置 。 


“离散 化 ”设置 
单 击 “ 离 散 化 ”按钮 ， 弹 出 如 图 14-21 所 示 
的 “MCA: 离散 化 ”对 话 框 。 


图 14-20 


“MCA: 


“MCA: 定 义 变量 权重 ”对 话 框 图 14-21 “MCA: 离散 化 ”对 话 框 
离散 化 ”对 话 框 主要 用 于 选择 对 变量 重新 编码 的 方法 ， 即 分 类 方法 。 由 于 多 重 


对 应 分 析 的 变量 都 是 分 类 名 义 变量 , 因此 需要 对 不 符合 要 求 的 变量 取 值 进行 离散 化 , 如 通过 按 
照 升序 字母 数值 顺序 分 配 类 别 指示 符 , 字符 串 变 量 总 是 转换 为 正 整 数 , 字符 串 变量 的 离散 化 适 
用 于 这 些 整 数 。 具 体 包括 : 


@ “变量 ”列表 框 。 该 列表 框 主要 用 于 存放 多 重 对 应 分 析 的 分 析 变 量 ， 变 量 名 的 括号 中 
表示 该 变量 的 离散 化 方法 。 
名 “方法 ”下 拉 列 表 框 。 该 下 拉 列 表 框 主要 用 于 选择 变量 离散 化 的 方法 ,如 表 14-3 所 示 。 


选项 
未 指定 


表 14-3 “方法 ”下 拉 列 表 框 中 选项 的 含义 


含义 及 其 他 
表示 不 指定 任何 离散 化 方法 


分 组 


表示 将 选 定 的 变量 重新 编码 为 指定 数量 的 类 别 , 或 者 按 区 间 重 新 编码 类 别 , 然后 在 “类 别 数 ” 
文本 框 中 输入 分 类 的 数目 ， 并 选择 “类 别 数 ”进行 选 定 变量 取 值 的 分 布 是 “ 正 态 ”还 是 “ 均 
匀 ”， 或 者 选中 “等 宽 区 间 ” 单 选 按 钮 指定 重新 编码 的 间隔 区 间 


等 级 


表示 将 通过 对 变量 个 案 排 秩 来 进行 分 类 


342 
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选择 离散 化 方法 后 ， 单 击 “ 变 化 量 ”按钮 即 可 。 

“缺失 ”设置 

单 击 “ 缺 失 ” 按 钮 ， 弹 出 如 图 14-22 所 示 的 “MCA: 
缺失 值 ”对 话 框 。 

“MCA: 缺失 值 ”对 话 框 主要 用 于 设置 缺失 值 的 方法 ， 
包括 两 个 选项 组 。 


@ “缺失 值 策略 ”选项 组 。 该 选项 组 中 包含 “分 析 变 
量 ”和 “补充 变量 ”两 个 列表 框 ， 分 别 用 于 存放 分 析 变量 
和 补充 变量 。 

@ “策略 ”选项 组 。 该 和 项 组 用 于 指定 处 理 缺 失 值 的 Er 
方法 。 ee 
。 排除 缺失 值 :以便 在 量化 后 进行 相关 性 插 补 : 该 单 选 | | oo 

示 EE , | k 量 只 @0) OMG 
TREE 
模式 .如 果 消极 处 理 所 有 变量 ， 则 所 有 变量 都 有 缺失 
值 的 对 象 将 视 为 补充 对 象 。 如 果 选 择 输出 相关 矩阵 ，。 图 14.22 “MCA: 缺 失信 ”对 话 杠 
则 缺失 值 的 替换 方式 有 : 
> “ 雁 数 ”表示 将 缺失 值 替换 为 最 优 刻度 化 变量 的 众 数 
> “附加 类 别 ”表示 将 缺失 值 蔡 换 为 附加 类 别 的 定量 ， 这 意味 着 此 变量 有 负 失 值 的 对 象 

被 视 为 属于 同一 (附加) 类别 . 

。 插 补 缺失 值 : 该 单 选 按钮 表示 对 选 定 变 量 有 缺失 值 的 对 象 进行 归 因 ， 该 方法 为 积极 处 理 广 
法 ， 即 推算 播 补 模式 .其 中 插 补 方法 亦 有 两 种 众 数 和 附加 类 别 。“ 众 数 ”表示 将 缺失 值 
替换 为 最 频繁 的 类 别 ， 当 有 多 个 众 数 时 将 使 用 具有 最 小 类 别 指示 符 的 众 数 ; 选择 “附加 类 
别 ”含义 相同 ， 

。 排除 对 于 此 变量 具有 缺失 值 的 对 象 : 该 单 选 接 包 表示 从 对 应 分 析 中 排除 选 定 变量 的 缺失 值 
对 象 ， 该 方法 不 适用 于 补充 变量 。 

“选项 ”按钮 

单 击 “ 选 项 ”按钮 ， 弹 出 如 图 14-23 所 示 的 “MCA 选项 ” 对话 框 。 

“MCA: 选项 ” 对 话 框 主要 用 于 选择 初始 配置 、 指 定 迭 代 和 收敛 标准 、 选 择 正 态 化 方法 、 
选择 标记 图 的 方法 及 指定 附加 对 象 


中 “补充 对 象 ”选项 组 。 该 选项 组 用 于 指定 要 其 成 为 附加 对 象 的 个 案 编号 。 

。 个 案 范围 : 表示 对 对 象 范围 的 第 一 个 和 最 后 一 个 个 案 编 号 ， 在 “第 一 个 ”和 “最 后 一 个 ” 
文本 框 中 输入 编号 ， 然 后 单 击 “ 添 加 ”按钮 进入 附加 对 象 列 表 框 。 

。 单个 个 案 : 表示 如 果 将 某 个 对 象 指定 为 附加 对 象 , 则 对 于 该 对 象 将 忽略 个 案 权重 。 单 击 “ 更 
改 ” 按 钮 ， 可 以 对 选 定 的 附加 对 象 进 行 更 改 设置 ; 单 击 “ 删 除 ” 按 钮 ， 可 以 删除 已 经 设置 
好 的 附加 对 象 。 
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图 14-23 “MCA: 选项 ”对 话 框 


@ “ 正 态 化 方法 ”选项 组 。 该 选项 组 用 于 指定 变量 标准 化 得 分 的 正 态 化 方法 。 有 以 下 几 
种 方法 : 


。 变量 主 成 分 : 表示 优化 变量 之 间 的 关联 ， 对 象 空间 中 的 变量 坐标 是 成 分 载 入 (与 主 成 分 的 
相关 性 ， 如 维和 对 象 得 分 ) 。 
对 象 主 成 分 : 表示 优化 对 象 间 的 距离 ， 适 用 于 关注 对 象 之 间 的 区 别 或 相似 性 的 情况 。 
对 称 : 相当 于 简单 对 应 分 析 中 的 对 称 方法 ， 适 用 于 关注 对 象 和 变量 之 间 的 关系 的 情况 。 
独立 : 适用 于 单独 检查 对 象 之 间 的 距离 和 变量 之 间 的 相关 性 。 
定制 : 表示 用 户 自己 指定 介 于 -1 和 1 之 间 的 值 ，“-1” 相 当 于 “主要 变量 ”“1” 相 当 于 
“主要 对 象 ”“0” 相 当 于 “对 称 ”， 而 其 他 值 不 同 程度 地 将 “惯量 ”特征 值 分 布 于 对 象 
和 变量 上 。 

@ “条 件 ” 选 项 组 。 该 选项 组 用 于 设置 碗 代 收 敛 标准 。 在 “最 大 达 代 次 数 ” 文 本 框 中 输 
入 最 大 迭 代 次 数 ， 在 “收敛 ”文本 框 中 输入 收敛 临界 值 ， 即 循环 求解 的 最 后 两 个 模型 拟 合 优 度 
之 差 小 于 该 值 ， 则 停止 迭代 。 

@@ “图 的 标注 依据 ”选项 组 。 该 选项 组 用 于 指定 在 图 中 将 使 用 变量 和 值 标签 还 是 变量 名 
称 和 值 。 选 中 “变量 标签 或 值 标签 ” 单 选 按钮 ， 表 示 在 图 中 将 使 用 变量 和 值 标签 ; 选择 “变量 
名 称 或 值 ” 单 选 按钮 ， 表 示 在 图 中 将 使 用 变量 名 称 和 值 。 

@ “图 维 ”选项 组 。 该 选项 组 主要 用 于 设置 图 的 维 数 。 

e 显示 解 中 所 有 的 维 : 该 单 选 按钮 表示 行 和 列 的 维 数 显示 在 交叉 表 中 。 

e 限制 维 数 : 该 单 选 按 钮 表示 限制 输出 的 维 数 ， 在 “最 低 维 ” 文 本 框 中 输入 从 1 到 总 维 数 减 

1 的 整数 ， 在 “最 高 维 ” 文 本 框 中 输入 从 2 到 总 维 数 的 整数 。 
“输出 ”设置 
单 击 “ 输 出 ”按钮 ， 弹 出 如 图 14-24 所 示 的 “MCA: 输出 ”对 话 框 。 
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“MCA: 输出 ”对 话 框 主要 用 于 为 对 象 得 分 、 区 分 测 。 vs x 
量 、 远 代 历 史 、 原 始 变 量 和 转换 后 变量 的 相关 性 、 选 定 的 变 。 | [让 E 
量 的 类 别 量化 和 选 定 的 变量 的 描述 统计 生成 表 。 Temee ramet 
@“ 表 "选项 组 。 该 选项 组 用 于 设置 输出 相关 统计 量 。 一 
。 对 象 得 分 : 该 复 选 框 表示 输出 对 象 得 分 表 ， 包 括 质量 、 ee 
惯量 和 贡献 。 一 旦 选中 “对 象 得 分 ” 复 选 框 ， 则 “对 象 i 
得 分 选项 ”就 会 被 激活 。 选 入 “包括 下 列 对 象 的 类 别 ”| | 
列表 框 的 分 析 变量 将 输出 该 变量 的 类 别 信息 ， 选 入 “对 2 
象 得 分 的 标注 依据 ”的 标签 变量 将 用 于 标注 对 象 EE 
。 区 分 测量 : 该 复 选 框 表示 输出 每 个 变量 和 每 一 维 的 区 


分 测量 。 tt 

。 奖 代 历史 记录 : 该 复 选 框 表 示 输 出 迭代 中 偏差 的 变化 。 图 14-24 “MCA: 输出 ”对 话 杠 

。 原始 变量 的 相关 性 : 该 复 选 框 表示 输出 原始 变量 的 相关 性 矩阵 及 该 矩阵 的 特征 值 。 

。 转换 后 变量 的 相关 性 : 该 复 选 框 表示 输出 转换 变量 的 相关 性 矩阵 及 该 矩阵 的 特征 值 。 

@ “类 别 量化 及 贡献 ”列表 框 。 该 列表 框 用 于 输出 选 定 变量 的 每 一 维度 的 类 别 量化 〈 坐 
标 ) ， 包 括 质量 、 惯 量 和 贡献 。 

@ “描述 统计 ”列表 框 。 该 列表 框 用 于 输出 选 定 变量 的 频率 、 缺 失 值 的 数量 及 众 数 等 描 
述 性 统计 量 信息 。 


“保存 ”设置 


图 14-25 “MCA: 保存 ”对 话 框 
“MCA: 保存 ”对 话 框 主要 用 于 进行 保存 设置 。 


QD “高 散 化 数据 ”选项 组 。 选 中 “创建 离散 化 数据 ” 复 选 框 ， 则 “创建 新 数据 集 ” 和 “ 写 
入 新 数据 文件 ” 单 选 按钮 被 激活 。 选 中 “创建 新 数据 集 ” 单 选 按钮 ， 表 示 建 立 一 个 新 数据 集 来 
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保存 离散 化 数据 , 在 “数据 集 名 称 ” 文 本 框 中 输入 该 新 数据 集 的 名 称 。 选中“ 写 入 新 数据 文件 ” 
单 选 按钮 ， 表 示 建 立 一 个 外 部 SPSS Statistics 数据 文件 保存 离散 化 数据 ， 单 击 “ 文 件 ” 按 钮 选 
择 文件 。 

@@ “转换 后 变量 ”选项 组 。 该 选项 组 用 于 保存 已 转化 的 变量 ， 具体 用 法 与 “离散 化 数据 ” 
一 致 。 

@@ “对 象 得 分 ”选项 组 。 该 选项 组 用 于 保存 对 象 得 分 ， 具 体 用 法 与 “离散 化 数据 ”一 致 。 

图 多 重 名 义 维 。 该 选项 用 于 将 指定 数据 保存 至 当期 活动 数据 文件 中 。 


。 全 部 : 该 单 选 按钮 表示 保存 所 有 维度 得 分 。 
。 第 一 个 : 该 单 选 按钮 表示 可 以 指定 保存 数据 的 最 大 维度 。 


“对 象 ” 设置 起 MCA : Ms 加 x 
单 击 “ 对 象 ” 按钮 , 弹出 如 图 14-26 所 示 的 |a - 
“MCA: 对 象 图 ”对 话 框 。 i a 
“MCA: 对 象 图 ” 对话 框 用 于 指定 所 要 的 图 | 
类 型 及 要 绘图 的 变量 。 


。 对 象 点 : 该 复 选 框 表示 输出 对 象 点 的 图 。 一 
旦 选中 该 复 选 框 ， 则 “标注 对 象 ”选项 组 就 
会 被 激活 。 在 “标注 对 象 " 选项 组 中 选中 “个 
案 号 ” 单 选 按钮 ， 表 示 “ 可 用 ”列表 框 中 的 


所 有 变量 用 作 标签 变量 ， 选 中 “变量 ” 单 选 | sxxso 全 
按钮 ， 则 为 每 个 变量 生成 一 个 图 。 Se ee 
。 对 象 和 质心 ( 双 标 图 ) : 该 复 选 框 表示 输出 
对 象 点 和 其 中 心 点 的 双 标 图 ， 一 旦 选中 该 复 
选 框 , 则 “ 双 标 图 变量 ” 选项 组 就 会 被 激活 。 图 14-26 “MCA: 对 象 图 ”对 话 杠 
在 “ 双 标 图 变量 ” 选项 组 中 选中 “所 有 变量 ” 
单 选 按钮 ， 表 示 “ 可 用 ”列表 框 中 的 所 有 变 
量 都 用 于 双 标 图 ， 选 中 “ 选 定 变量 ” 单 选 按 
钮 ， 表 示 在 “可 用 ”列表 框 中 选择 变量 用 于 
双 标 图 。 
“变量 ”设置 
单 击 “ 变 量 ”按钮 ， 弹 出 如 图 14-27 所 示 的 
“MCA: 变量 图 ”对 话 框 。 
“MCA: 变量 图 ”对 话 框 用 于 指定 所 要 的 图 
类 型 和 要 绘制 的 变量 。 
@ “类 别 图 ”列表 框 。 该 列表 框 用 于 对 选 定 
的 每 个 变量 绘制 质心 坐标 图 。 
@ “联合 类 别 图 ”列表 框 。 该 列表 框 用 于 对 
每 个 选 定 的 变量 的 质心 坐标 绘制 单个 图 。 人 


引用 
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@ “转换 图 ”列表 框 。 该 列表 框 用 于 输出 最 优 类 别 量化 与 类 别 指示 符 的 比较 图 。 在 “ 维 
数 ” 文 本 框 中 输入 指定 维 数 ， 将 为 每 一 维 分 别 生成 一 个 图 。 如 果 选 中 “包括 残 差 图 ” 复 选 框 ， 
则 输出 每 个 选 定 的 变量 的 残 差 图 。 

@ “区 分 测量 ”选项 组 。 该 选项 组 用 于 为 变量 生成 区 分 测量 的 单个 图 。 

。 选中 “显示 图 ” 复 选 框 ， 表 示 输出 区 分 测量 的 图 。 

。 选中 “使 用 所 有 变量 ” 单 选 按钮 ， 表 示 为 所 有 变量 生成 区 分 测量 的 单个 图 。 

。 选中 “使 用 选 定 变量 ” 单 选 按钮 ， 表 示 为 选 定 变量 生成 区 分 测量 的 单个 图 。 

4) 分 析 结 果 输 出 。 

设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 多 重 对 应 分 析 的 
结果 。 


14.2.3 ”实验 操作 


下 面 将 以 数据 文件 “14-2” 为 例 ， 讲 解 多重 对 应 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 
1. 实验 数据 描述 


数据 文件 “14-2” 来 源 于 SPSS 24.0 自 带 的 数据 文件 screws.sav， 本 书 对 该 数据 文件 进行 
了 适当 修改 。 该 数据 文件 包含 关于 螺钉 、 螺 栓 、 螺 母 和 图 钉 的 特征 信息 ， 利 用 多 重 对 应 分 析 方 
法 ， 分 析 特 征 与 所 属 分 类 的 对 应 关系 。 原 始 Excel 数据 文件 如 图 14-28 所 示 。 


沿 ] 工具 工 


D 
底部 “长度 英寸 ) 
尖锐 


尖锐 
尖锐 


1 
4 
2 
2 
2 
2 
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3 
3 
5 
4 
4 
2 
2 
4 
1 


圆 形 狭长 切口 
图 14-28 数据 文件 “14-2” 的 原始 数据 

在 SPSS 变量 视图 中 建立 变量 “螺纹 ”“ 头 部 ”“ 头 部 上 四 槽 ”“ 底 部 ”“ 长 度 ”“ 铜 制 ” 
和 “对 象 ”， 分 别 表示 螺钉 、 螺 栓 、 螺 母 和 图 钉 的 头 部 、 头 部 四 槽 、 底 部 、 长 度 、 铜 制 等 信息 ， 
并 分 别 对 每 个 变量 进行 定义 和 赋值 ， 如 图 14-29 所 示 。 

在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 
数据 如 图 14-30 所 示 。 
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赵 所 对 应 分 析 .sav 熙 王 条 1] - 18M SPSS Statistics 郑 器 肝 挟 溉 = 口 x 
文件 四 编 加 EE) 查看 WW) 数据 忆 ) 转换 中 分析 办 直 稍 加 国 Y(G) 闪 用 程序 册 ) 六 时 外 证 DW) 帮助 叫 


名 称 |】 类型。 训 康 | 小 数位 数 。 标 和 值 缺失 | 到 对 齐 | 列 旱 | 角色 | 
| 诡 郭 字 和 于 1 0 后 部 形 杖 ”人 ,平面 。 无 1 藉 左 而 名 义 \ 输入 
5 长 度 数字 1 0 长 度 (以 {1,1/2 英 站 无 8 自 右 沽 有 序 区 入 
6 调制 字 行 率 1 0 人 {N, 丰 秽 册 .无 ”1 者 左 向 名 X 入 入 
了 | 对 名 。 字 答 素 6 0 天 无 6 医 左 高 名 义 输入 
8 |theadn 教 字 1 0 {1, 没有 螺 织 无 ”8 浑 右 动 有 尺 输入 
9 headn 数字 1 0 头 部 形 拓 ” {1 平 司 无 8 爱 右 二 及 ~ 仿 入 
和 |ndheadn 冰 宁 1 0 头 逆 目 窒 。(1. 按 长 的 切 、 无 “8 洗 右 咕 及 输入 
1 “| 底部 形 所 数字 1 0 坊间 形状 “人 平 辐 、 无 8 握 右 关 有 FA 输入 
人 |bass 数字 1 0 1 非 筒 所- 无 “8 ”和正 右 咕 有 床 第 入 
人 |obecn 数字 2 0 人 (1.60LTY) 无 8 潮 右 天 有 床 多 入 
人 |iengthn 教 字 1 0 长 度 (以 {1.1/2 页 站 无 8 洱 右 二 有 斥 汪 输入 
15. ”|botoml 数字 1 0 民间 形状 ”人 1 平 辐 、 无 8 王 右 咕 衣 FA 输入 
四 jmssl 条 1 0 化 非 铀 制 无 8 尝 右 咕 有 序 ~ 多 入 
各 ”|head 数字 1 0 头 部 形状 ”人 1. 平 硬 - 无 8 酒 右 咕 有 序 \ 答 入 
但 jndheadl 雪 字 1 0 头 部 回 粮 {1, 冬 长 的 切 无 “8 者 右 咕 有 床 第 入 
得 jengh 8 字 1 0 长 度 ( 以 (1.12 砚 中 无 8 性 右 咕 有 AN 全 入 
20 |thread 元 字 1 0 人 没有 曲 绞 无 8 泥 右 确 有 尺 \ 输入 


TB SPSS Sialistics 处 理 程 序 绩 | |UnicodeON| | 


图 14-29 数据 文件 “14-2” 的 变量 视图 


起 "多 重 对 应 分 析 sav [ 若 沁 抹 1] - I8M SPSS Statistics 数理 生生 加 


<n<noccennnnnng 
rrr zz 


NinlIn|InlnINi -| -| -| -l= -| -| -| 


TEN SPSS Statscs 直达 程序 由 线 | | Unicode.ON | | 


14-30 ”数据 文件 “14-2” 的 数据 视图 


2. 实验 操作 步骤 


有 具体 操作 步骤 如 下 : 


GE56i) 打开 “14-2” 数 据 文 件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 降 维 ”|” 最 优 标 度 ” 命 令 ， 打 开 “最 优 标 度 ” 对 话 框 ， 单 击 “ 定 义 ” 按 钮 ， 
打开 “多 重 对 应 分 析 ” 对 话 框 。 从 源 变 量 列表 中 选择 变量 “螺纹 ”“ 头 部 ”“ 头 部 目 
槽 ”“ 底 部 ”“ 长 度 ” 和 “ 铜 制 ” 选 入 “分 析 变 量 ” 列 表 框 ， 选 择 “ 对 象 ” 选 入 “ 标 
注 变量 ”列表 框 。 


348 


第 14 章 ”对 应 分 析 


本》 单 击 “ 对 象 ”按钮 ， 打 开 “MCA: 对 象 图 ”对 话 框 ， 选 中 “ 选 定 变量 ” 单 选 按钮 ， 
将 “螺纹 ”“ 头 部 ”“ 头 部 四 槽 >“ 底部 ”“ 长 度 ” 和 “ 铜 制 ” 选 入 “ 选 定 ”列表 框 ， 
单 击 “ 继 续 ”按钮 ， 保 存 设置 结果 。 

GES63 单 击 “确定 ”按钮 ， 便 可 以 得 到 简单 对 应 分 析 结果 


3. 实验 结果 及 分 析 模型 摘要 
方 券 所 占 百分比 
SPSS Statistics 查看 器 窗口 的 输出 结果 如 i | 
14-31~ 图 14-33 所 示 。 1 878 3.727 621 62.123 
图 14-31 给 出 了 模型 摘要 结果 。 该 图 给 出 了 各 ”于 el 


个 维度 上 的 特征 值 、 惯量 和 解释 的 方差 百分比 的 信 。 3% I et ne 
息 。 如 第 一 维度 和 第 二 维度 上 分 别 可 以 解释 数据 变 .克隆 巴赫 Alpha 平均 值 基于 平均 特征 值 
异 的 62% 和 36%。 14-31 ”模型 摘要 

图 14-32 给 出 了 区 分 测量 的 信息 。 大 的 区 分 测量 相当 于 一 个 变量 在 类 别 上 较 大 的 分 散 ， 即 
指 沿 着 该 维度 在 变量 类 别 上 有 一 个 高 的 区 分 度 。 如 底部 形状 和 螺纹 在 第 一 维度 上 有 很 大 的 区 分 
测量 , 而 在 第 二 维度 上 很 小 , 说 明 这 两 个 变量 类 别 属性 仅仅 在 第 一 维度 上 有 高 的 区 分 度 和 分 散 
度 。 长 度 在 第 二 维度 上 有 高 的 区 分 度 说 明 第 二 维度 能 够 把 长 度 变 量 区 分 开 来 。 头 部 止 槽 和 头 部 
形状 在 两 个 维度 上 区 分 都 很 好 , 而 铜 制 在 两 个 维度 上 都 没有 区 分 , 实际 上 是 因为 所 有 对 象 都 是 
铜 制 的 或 不 是 铜 制 。 

图 14-33 给 出 了 按 头 部 形状 加 注 标签 的 对 象 点 在 各 个 维度 上 的 得 分 图 。 带 有 多 种 与 最 频繁 
的 类 别 相 当 的 属性 的 对 象 就 会 落 在 与 直角 较 近 的 位 置 , 而 带 有 单一 属性 的 对 象 则 远离 直角 。 从 
该 图 可 以 看 到 , 在 第 一 维度 上 将 头 部 形状 为 圆 形 、 圆 柱 形 的 与 头 部 形状 为 平面 、 杯 形 的 区 分 开 
来 ， 同 时 第 二 维度 上 将 锥 形 、 杯 形 与 圆 形 、 圆 柱 形 区 分 开 来 。 总 体 上 ， 锥 形 的 远离 直角 说 明 锥 
形 的 螺丝 带 有 的 特性 是 其 他 类 别 螺丝 所 不 具有 的 。 因 此 对 象 得 分 对 于 识别 特殊 点 非常 有 用 。 


区 分 测量 由 头 部 形状 标注 的 对 象 点 
负 开 
4 D 
| 
所 起 门 怕 
维 了 新 并 
S o 
2 杯 形 
A oz 
叫 圆柱 形 国 形 
国 柱 于 平面 平面 
mo ST 
度 部 形状 [a 圆柱 邢 Tp Tm 
十 T T T T T T T 
02 04 056 08 10 -5 -10 -05 00 05 10 15 
维 1 维 1 
变量 主 成 分 正太 化 。 变 最 主 成 分 正 态 化 。 
图 14-32 区 分 度量 14-33 ”由 头 部 形状 标注 的 对 象 点 
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14.3 上 机 题 


视频 文件 ,wideo\ 上 机 题 教学 视频 chap13 -wmv 


司 视频 文件 ，\sample\ 上 机 题 \chap1\.… 


14.1 某 大 学 农学 院 进行 了 豌豆 遗传 性 状 的 实验 ， 静 豆 杆 的 性 状 和 吏 豆 果实 的 性 状 如 数 
据 文 件 所 示 ， 其 中 数据 文件 中 的 “1”“2”“3” 分 别 表示 更 豆 的 不 同性 状 。 试 进行 对 应 分 析 
， 分 析 豌 豆 杆 的 性 状 和 纹 豆 果实 的 性 状 的 对 应 关系 。 部 分 指标 数据 如 下 表 所 示 ( 数 据 路 径 ， 视 
频 文件 sample\ 上 机 题 \chap14\ 习 题 \ 第 14 章 第 一 题 -sav) 。 


豌豆 性 状 果实 性 状 频数 
1.00 1.00 98.00 
1.00 2.00 48.00 
Im mm 
1.00 4.00 681.00 
1.00 5.00 85.00 
20 | EE 
2.00 3.00 909.00 
2.00 4.00 412.00 
2.00 5.00 26.00 
3.00 2.00 38.00 
3.00 3.00 241.00 
3.00 4.00 110.00 
sm 四 


(1) 试 计算 对 应 分 析 的 对 应 表 ， 熟 悉 各 个 变量 的 频率 分 布 情况 。 

(2) 采用 对 应 分 析 计算 行 得 分 和 列 得 分 在 二 维 上 的 散 点 图 ， 并 通过 图 表 的 形式 分 析 类 别 
和 样本 之 间 的 潜在 关系 。 

14.2 某 公司 就 各 个 部 门人 员 的 酮 酒 状况 进行 了 调研 ， 调 研 数据 按 部 门 类 别 区 分 人 员 柄 
酒 行为 交叉 制 表 。 变 量 “ 部 门 ” 包 含 管理 部 、 财 务 部 和 项 目 部 ， 变量 “醒酒 状况 ” 按 程 度 分 
为 重度 、 较 重 、 中 度 、 较 轻 和 从 不 5 种 ， 用 数字 1~5 表示 ; 变量 “计数 ”是 对 该 类 别 数目 的 
描述 ， 即 该 种 情况 的 权重 。 部 分 数据 如 下 表 所 示 数据 路 径 : 视频 文件 sample\ 上 机 题 \chap14\ 
习题 \ 第 14 章 第 二 题 .sav) 。 
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部 门 醒酒 状况 计数 
管理 部 1.00 343.00 
管理 部 2.00 84.00 
管理 部 3.00 909.00 
管理 部 4.00 412.00 
管理 部 5.00 26.00 
财务 部 1.00 326.00 
财务 部 2.00 38.00 
财务 部 3.00 241.00 
财务 部 4.00 110.00 
财务 部 5.00 3.00 
项 目 部 1.00 688.00 
项 目 部 2.00 116.00 
项 目 部 3.00 584.00 
项 目 部 4.00 188.00 
项 目 部 5.00 4.00 


试 采用 对 应 分 析 分 析 各 个 变量 在 二 维 上 的 散 点 图 , 并 结合 对 应 表 分 析 该 公司 部 门人 员 和 柄 
酒 状况 联系 。 
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时 间 序 列 分 析 是 一 种 动态 数据 处 理 的 统计 方法 。 该 方法 基于 随机 过 程 理论 和 数理 统计 学 方 
法 , 研究 随机 数据 序列 所 遵从 的 统计 规律 ， 以 藉 此 解决 实际 问题 。 在 现实 中 ,许多 统计 资料 都 
是 按照 时 间 进 行 观测 记录 的 , 因此 时 间 序 列 分 析 在 实际 分 析 中 具有 广泛 的 应 用 。 时 间 序 列 是 按 
随机 过 程 的 一 次 实现 ， 具 有 随时 间 而 变化 、 动 态 性 和 随机 性 数字 序列 等 特点 。 

时 间 序 列 模型 不 同 于 一 般 的 经 济 计量 模型 , 其 不 以 经 济 理论 为 依据 , 而 是 依据 变量 自身 的 
变化 规律 , 利用 外 推 机 制 描述 时 间 序列 的 变化 。 时 间 序 列 模型 在 处 理 的 过 程 中 必须 明确 考虑 时 
间 序 列 的 非 平稳 性 。 在 SPSS 中 提供 了 多 种 进行 时 间 序 列 分 析 的 方法 ， 本 章 将 介绍 这 些 方法 。 


15.1 时 间 序 列 数据 的 预 处 理 


SPSS 无 法 自动 识别 时 间 序列 数据 ， 并 且 时 间 序 列 数据 在 处 理 的 过 程 中 必须 明确 考虑 时 间 
序列 的 非 平稳 性 ， 因 此 在 进行 时 间 序列 分 析 前 ， 必 须 对 时 间 序 列 进行 预 处 理 。 


15.1.1 定义 时 间 变 量 

在 SPSS 中 进行 时 间 序列 分 析 或 建 模 ， 必 须 先 根据 数据 的 时 间 格 式 进行 时 间 变量 定义 ， 否 
则 SPSS 不 会 将 数据 自动 识别 为 时 间 序 列 数据 ， 而 是 作为 普通 数据 处 理 。 定 义 时 间 变 量 的 具体 
方法 如 下 。 

1) 在 菜单 栏 中 选择 “数据 ” |“ 定义 日 期 和 时 间 ” 命 令 ， 打 开 如 图 15-1 所 示 的 “定义 日 
期 ”对 话 框 。 

2) 进行 相应 的 设置 。 在 “定义 日 期 ”对 话 框 的 “个 案 是 ”列表 框 中 选择 要 定义 的 时 间 格 
式 ， 然 后 在 “第 一 个 个 案 是 ”中 定义 数据 开始 的 具体 时 间 ， 如 年 、 季 度 、 周 、 小 时 等 。 


。 个 案 是 : 该 列表 框 中 提供 了 19 种 不 同 的 日 期 格式 ， 包 括 年 份 、 季 度 、 月 份 、 日 、 星 期 、 
工作 日 、 小 时 、 分钟 等 ,可 自由 选择 。 如 果 需 要 分 析 的 时 间 序 列 为 跨年度 的 季度 时 间 序 列 ， 
则 选择 “年 份 、 季 度 ” 即 可 。 
e 第 一 个 个 案 是 : 该 选项 组 用 于 定义 时 间 变 量 的 起 始 日 期 。 一 旦 选中 “个 案 是 ”列表 框 中 的 
选项 ， 则 会 在 此 显示 相应 的 时 间 格式 。 如 在 “个 案 是 ”列表 框 中 选择 “年 ， 月 ”， 则 显示 
如 图 15-2 所 示 的 对 话 框 。 
在 “年 ”和 “月 ”文本 框 中 输入 数据 开始 的 具体 年 份 和 季度 ， 然 后 单 击 “确定 ”按钮 就 可 
以 完成 时 间 变 量 的 定义 。 定 义 完毕 后 ，SPSS Statistics 的 数据 视图 中 就 会 出 现 定义 的 时 间 变 量 。 
这 里 ，“ 更 高 级 别 的 周期 长 度 ” 显 示 该 时 间 格 式 下 的 周期 。 
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图 15-1 选择 要 定义 的 时 间 格 式 


15.1.2 ”时 间 序 列 数 据 的 平稳 化 处 理 


15-2 ”定义 数据 的 起 始 时 间 


打开 相应 的 数据 文件 或 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 


对 时 间 序 列 数 据 进行 平稳 化 。 


1) 在 菜单 栏 中 选择 “转换 ”|“ 创 建 时 间 序 列 ” 命 令 ， 打 开 如 图 15-3 所 示 的 “创建 时 间 


序列 ”对 话 框 。 

此 创建 时 间 序 列 
变量 -> 新 名 称 (A) 

US spread [SPREAD] 国 

YEAR, not penodicl 

NONTH, period 12[. 


15-3 


[CE ] ee Eg EE) 


“创建 时 间 序列 ”对 话 杠 


2) 选择 变量 。 从 源 变 量 列表 框 中 选择 需要 进行 平稳 化 处 理 的 变量 ， 然 后 单 击 国 按 钮 将 选 
中 的 变量 选 入 “变量 -> 新 名 称 ” 列 表 框 中 。 进 入 “变量 -> 新 名 称 ” 列 表 框 中 的 变量 显示 为 “新 


变量 名 称 = 平稳 函数 〈 原 变量 名 称 顺序 ) ”。 


3) 进行 相应 的 设置 。 在 “名 称 和 函数 ”选项 组 中 可 以 对 平稳 处 理 后 生成 的 新 变量 重 命名 
并 选择 平稳 化 处 理 的 方法 ,设置 完毕 后 单 击 “ 变 化 量 ” 按钮 就 完成 了 新 变量 的 命名 和 平稳 化 处 


理 方法 的 选择 。 


SPSS 提供 了 8 种 平稳 处 理 的 方法 ， 各 选项 及 其 功能 如 表 15-1 所 示 。 
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表 15-1 “函数 ”下 拉 列 表 框 中 的 选项 及 功能 


方法 功能 
指 对 非 季 度数 据 进行 差分 处 理 。 其中, 一 阶 差分 即 数据 前 一 项 减 去 后 一 项 得 到 的 值 ， 
差异 此 一 阶 差分 会 损失 第 一 个 数据 。 同 理 ，n 阶 差分 会 损失 前 n 个 数据 。 在 “顺序 ”文本 框 
中 输入 差分 的 阶 数 。 差 分 是 时 间 序 列 非 平稳 数据 平稳 处 理 的 最 常用 的 方法 ， 特 别 是 在 
ARIMA 模型 中 
季节 性 差异 指 对 季节 数据 进行 差分 处 理 。 其 中 , 一 阶 差 分 指 该 年 份 的 第 n 季度 的 数据 与 下 一 年 份 第 
n 季度 的 数据 做 差 。 由 于 每 年 有 四 个 季节 ， 因 此 m 阶 差分 就 会 损失 m 个 数据 
中 心 移动 平均 值 指 以 当期 值 为 中 心 取 指定 跨度 内 的 均值 ， 在 “跨度 ”文本 框 中 指定 取 均 值 的 范围 。 该 方 
法 比较 适用 于 正 态 分 布 的 数据 
前 移动 平均 值 指 取 当期 值 以 前 指定 跨度 内 的 均值 ， 在 “跨度 ”文本 框 中 指定 取 均 值 的 范围 
运行 中 位 数 指 以 当期 值 为 中 心 取 指定 跨度 内 的 中 位 数 ， 在 “跨度 ”文本 框 中 指定 取 中 位 数 的 范围 。 
其 中 ， 该 方法 与 中 心 移动 平均 方法 可 互 为 蔡 代 
累积 求 和 表示 以 原 数 据 的 累计 求 和 值 代 蔡 当期 值 
延迟 表示 以 原始 数据 滞后 值 代 苦 当期 值 ， 在 “顺序 ”文本 框 中 指定 滞后 阶 数 
提前 表示 以 原始 数据 提前 值 代 蔡 当期 值 ， 在 “顺序 ”文本 框 中 指定 提前 阶 数 
表示 对 原 数 据 进 行 T4253H 方法 的 平滑 处 理 。 该 方法 首先 对 原 数据 依次 进行 跨度 为 4、 
平滑 2、5、3 的 中 心 移动 平均 处 理 ， 然 后 以 Hanning 为 权重 再 做 移动 平均 处 理 ， 得 到 一 个 平 
滑 时 间 序 列 
设置 完毕 后 , 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 平稳 处 理 的 结果 。 


15.1.3 ”实验 操作 


下 面 将 以 数据 文件 “15-1” 为 例 ， 讲 解 时 间 序 列 数据 平稳 处 理 的 具体 操作 过 程 并 对 结果 进 


行 说 明 。 i 
守信 A | 区 ea 行 
1. 实验 数据 描述 Ww gr | [BE SE 二 > 国 ssaaa - 
数据 文件 “15-1” 记录 了 从 1960 
年 到 2008 年 美国 的 工业 生产 总 值 数 
据 、 美 国 10 年 期 国库 券 利率 与 联邦 基 | 区 FS 看 证 站 和 (X) 
金利 率 差额 ， 数 据 来 源 于 IFM 网 站 。 | 人 0 
原始 Excel 数据 文件 如 图 15-4 所 示 。 ”| 136om0t ER a 
在 SPSS 变量 视图 中 建立 变量 cip” |? 136oos 了 5 377 0 
8 |1960M07 25. 289 0.67 
和 “SPREAD”, 分 别 表示 美国 的 工业 | 338oos 人 2 
生产 总 值 数据 、 美 国 10 年 期 国库 券 利 | 入 io i 
率 与 联邦 基金 利率 差额 ， 并 对 每 个 变 “| 得 1202 ET Zs9 
量 进行 定义 ,定义 结果 如 图 15-5 所 示 。 |16 i361 站 四 3 
17 |1961N04 24.790 2.29 
|18 |1961105 25.171 1.73 
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最 时间 所 列 分 析 sav [数据 竺 1] - IBM SPSS Statistics 教 据 提 生 各 = 0 X 


TB SPSS Statistcs 处 至 程序 镁 结 | TUnicodeON | | 
图 15-5 “15-1” 数 据 文件 的 变量 视图 


然后 在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 
部 分 数据 如 图 15-6 所 示 。 


入 Ma 把 析 .sav | 散 包 二 1] - IBM SPSS Statistics 数据 织 反 器 二 一体 [全 


15-6 “15-1” 数据 文件 的 数据 视图 


2. 实验 操作 步骤 
具体 操作 步骤 如 下 : 
ES) 打开 数据 文件 “15-1”， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “数据 ” 
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1“ 定 义 日 期 和 时 间 ” 命 令 , 打开 “定义 日 期 ”对 话 框 在“ 个案 是 ”列表 框 中 选择 “年 
份 、 月 份 ”” 然 后 在 “第 一 个 个 案 是 ”选项 组 中 的 “年 ”和 “月 ”文本 框 中 输入 数据 
开始 的 具体 年 份 1960 和 月 份 1， 然 后 单 击 “ 和 确定 ”按钮 ， 完 成 时 间 变量 的 定义 。 
本 3 了 0> 在 菜单 栏 中 选择 “转换 ”|“ 创 建 时 间 序列 ”命令 ， 打 开 “ 创 建 时 间 序列 ”对 话 框 ， 
将 “ip” 变量 先入 “变量 -> 新 名 称 ”列表 框 中 ， 在 “ 通 数 ”下 拉 列 表 框 中 选择 “季节 


性 差异 ”选项 ， 单 击 “ 确 定 ”按钮 
3. 实验 结果 及 分 析 


在 SISS Statistics 查看 器 窗口 得 到 时 间 变 量 定 义 和 平 稳 处 理 的 结果 如 图 15-7 和 图 15-8 所 示 。 
15-7 给 出 了 对 “ip” 序 列 进行 平稳 处 理 的 信息 ， 从 中 可 以 看 到 平稳 处 理 后 的 新 序列 名 
称 为 a 该 序列 全 有 1 个 缺失 值 ， 有 效 个 案 为 587 个， 平稳 处 理 的 方法 是 DIFF (季节 
性 差分 方法 ) 。 


创建 的 序列 
华 缺失 值 的 个 案 访 号 
序列 名 称 。 第 一 个 “| 最 后 一 个 “有 效 个 案 数 ， 创建 函数 
J ip_1 2 588 587 DIFF(ip,1) 


15-7 创建 的 序列 


图 15-8 给 出 了 时 间 变 量 定义 和 对 “ip” 季 节 性 差分 在 SPSS Statistics 数据 视图 中 的 处 理 结 


果 ， 从 中 可 以 看 到 “DATE_” 序 列 即 新 定义 的 时 间 变 量 序列 ，“ip_1” 序 列 就 是 对 “ip” 序 列 
进行 季节 性 差分 平稳 处 理 后 生成 的 新 序列 。 由 于 采用 的 是 一 阶 季节 性 差分 方法 ， 因此 i 
序列 的 前 1 个 值 是 缺失 的 。 

上 "时 间 序列 分 析 sav [ 数 深 集 1] - IBM SPSS Statistics 数 问 篇 绢 器 一 口 x 


356 


六 人 四 _ 坟 呈 得 看 者 D) 针 机 DD 分 折 册 WW) BWG) 实用) 地 怖 0 盏 DG 2WQ 


12DEC1960 
1 JAN 1961 
2 FEB 1961 


JIBM SPSS Statistics 处 理 程 序 名 绪 | | |Unicode:ON| | | 


图 15-8 ”SPSS Statistics 数据 视图 中 的 处 理 结果 
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15.2 ”指数 平滑 法 


指数 平滑 法 可 以 将 不 规则 的 时 间 序 列 数 据 加 以 平滑 ,从 而 获得 其 变化 规律 和 趋势 , 并 以 此 
对 未 来 的 经 济 数据 进行 推断 和 预测 。 


15.2.1 ”指数 平滑 法 的 基本 原理 


指数 平滑 法 是 在 移动 平均 模型 基础 上 发 展 起 来 的 一 种 时 间 序 列 分 析 预 测 法 ， 其 原理 是 任 一 期 
的 指数 平滑 值 都 是 本 期 实际 观察 值 与 前 一 期 指数 平滑 值 的 加 权 平均 。 指 数 平滑 法 的 思想 是 对 过 去 
值 和 当前 值 进行 加 权 平均 ， 以 及 对 当前 的 权 数 进行 调整 以 抵消 统计 数值 的 摇摆 影响 ， 得 到 平滑 的 
时 间 序 列 。 指 数 平滑 法 不 舍弃 过 去 的 数据 ， 只 对 过 去 的 数据 给 予 逐 渐 减 弱 的 影响 程度 〈 权 重 ) 。 


15.2.2 ”指数 平滑 法 的 SPSS 操作 


在 SPSS Statistics 数据 编辑 器 窗口 中 建立 指数 平滑 法 的 具体 操作 步骤 如 下 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 时 间 序 列 预 测 ”|“ 创 建 传统 模型 ”命令 ， 打 开 如 图 15-9 
所 示 的 “时 间 序 列 建 模 器 ”对 话 框 。 


15-9 “时 间 序 列 建 模 器 ”对 话 框 


2) 选择 变量 和 方法 。 

从 源 变 量 列表 框 中 选择 建立 指数 平滑 法 的 因 变量 ,将 其 选 入 “ 因 变量 ”列表 框 中 。“ 因 变 
量 ” 和 “ 自 变 量 ” 列 表 框 中 的 变量 必须 为 数值 型 的 度量 变量 。 

在 “方法 ”下 拉 列 表 框 中 选择 “指数 平滑 ”选项 , 然后 单 击 “ 条 件 ”按钮 ， 弹 出 如 图 15-10 
“时 间 序 列 建 模 器 : 指数 平滑 条 件 ” 对 话 框 。 
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「 因 交 里 转换 
加 无 册 
© 下方 要 QO) 
© 自然 x 扫 中 


图 15-10 “时 间 序 列 建 模 器 : 指数 平滑 条 件 ” 对 话 框 
“时 间 序 列 建 模 器 : 指数 平滑 条 件 ” 对 话 框 用 于 设置 指数 平滑 法 的 类 型 和 因 变 量 的 形式 。 


“模型 类 型 ”选项 组 。 该 选项 组 用 于 设置 指数 平滑 法 的 类 型 ， 包括“ 非 季节 性 ”和 “ 季 
节 性 ”两 大 类 模型 。 
非 季节 性 的 指数 平滑 法 有 以 下 4 种 形式 : 


。 简单 : 选中 该 单 选 按钮 ， 表 示 使 用 简单 指数 平滑 法 ， 该 模型 适用 于 没有 趋势 或 季节 性 的 
序列 ， 其 唯一 的 平滑 参数 是 水 平 ， 且 与 ARIMA 模型 极为 相似 。 

。 霍 尔 特 线性 趋势 : 选中 该 单 选 按钮 ， 表 示 使 用 霍 特 线性 趋势 模型 ， 该 模型 适用 于 具有 线 
性 趋势 且 没 有 季节 性 的 序列 ， 其 平滑 参数 是 水 平和 趋势 ， 不 受 相互 之 间 值 的 约束 。 堆 
尔 特 模 型 比 布朗 模型 更 通用 ， 但 在 计算 大 序列 时 用 的 时 间 更 长 。 

。 布朗 线性 趋势 : 选中 该 单 选 按钮 ， 表 示 使 用 布朗 线性 趋势 模型 ， 该 模型 适用 于 具有 线性 
趋势 且 没 有 季节 性 的 序列 ， 其 平滑 参数 是 水 平和 趋势 ， 并 假定 二 者 等 同 

。 衰减 趋势 : 选中 该 单 选 按钮 ， 表 示 使 用 阻尼 指数 平滑 方法 ， 此 模型 适用 于 具有 线性 趋势 的 
序列 ， 且 该 线性 趋势 正 逐 渐 消失 并 且 没有 季节 性 ， 其 平滑 参数 是 水 平 、 趋 势 和 阻尼 趋势 。 


季节 性 的 指数 平滑 法 有 以 下 3 种 形式 : 


。 简单 季节 性 : 该 模型 适用 于 没有 趋势 并 且 季节 性 影响 随时 间 变 动 保持 恒定 的 序列 ， 其 平滑 
参数 是 水 平和 季节 。 

。 温 特 斯 加 性 : 该 模型 适用 于 具有 线性 趋势 且 不 依赖 于 序列 水 平 的 季节 性 效应 的 序列 ， 其 平 
滑 参 数 是 水 平 、 趋 势 和 季节 。 

。 温 特 斯 乘 性 : 该 模型 适用 于 具有 线性 趋势 和 依赖 于 序列 水 平 的 季节 性 效应 的 序列 ， 其 平滑 
参数 是 水 平 、 趋 势 和 季节 。 


@ “ 因 变 量 转换 ”选项 组 。 该 选项 组 用 于 对 因 变 量 进行 转换 设置 ， 有 3 个 选项 : 


。 无 : 表示 在 指数 平滑 法 中 使 用 因 变 量 的 原始 数据 。 
。 平方 根 : 表示 在 指数 平滑 法 中 使 用 因 变 量 的 平方 根 。 
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。 自然 对 数 : 表示 在 指数 平滑 法 中 使 用 因 变 量 的 自然 对 数 。 其 中 ，“ 平 方 根 ” 和 “自然 对 数 ” 
要 求 原始 数据 必须 为 正 数 

3) 进行 相应 的 设置 。 

“统计 ”设置 

单 击 “ 时 间 序 列 建 模 器 ”对 话 框 中 的 “统计 ”选项 卡 ， 如 图 15-11 所 示 。 

“统计 ”选项 卡 主要 用 于 设置 输出 的 统计 量 ， 包 括 : 

中 “ 按 模型 显示 拟 合 测量 、 杨 -博克 斯 统计 和 离 群 值 数 目 ” 复 选 框 。 该 复 选 框 表示 输出 模 
型 的 拟 合 度量 、 杨 -博克 斯 统计 量 和 离 群 值 的 数量 ， 且 只 有 选中 该 复 选 枉 ，“ 拟 合 测量 ”选项 
组 才能 被 激活 。 

@ “ 拟 合 测量 ”选项 组 。 该 选项 组 用 于 指定 输出 拟 合 测量 的 统计 量 表 ， 具 体 包括 以 下 8 
种 统计 量 : 


用 于 比 技术 Si8 计 
MANRG) 
门 天 天 自 相关 台 数 (ACF) 


天 基 刁 自 相关 加 得 IPACFJU) 
AMS) 


图 15-11 “统计 ”选项 卡 


。 平稳 了 方 : 表示 输出 平稳 及 方 统计 量 , 该 统计 量 用 于 比较 模型 中 的 固定 成 分 和 简单 均值 模 
型 的 差别 ， 取 正 值 时 表示 模型 优 于 简单 均值 模型 。 

。 及 方 : 表示 输出 模型 的 及 方 统计 量 ， 该 统计 量 表示 模型 所 能 解释 的 数据 变异 占 总 变异 的 比 
例 。 其 中 ， 当 时 间 序列 含有 趋势 或 季节 成 分 时 ， 平 稳 及 方 统计 量 要 优 于 及 方 统计 量 

。 均 方 根 误差 : 表示 输出 模型 的 均 方 误差 统计 量 ， 该 统计 量 衡量 模型 预测 值 与 原始 值 的 差异 
大 小 ， 即 残 差 的 标准 差 ， 度量 单位 与 原 数 据 一 致 . 

。 平均 绝对 误差 百分比 : 表示 输出 平均 绝对 误差 百分比 统计 量 ， 该 统计 量 类 似 于 均 方 误 差 统 
计量 ， 但 该 统计 量 无 度量 单位 ， 可 用 于 比较 不 同 模型 的 拟 合 情 况 

。 平均 绝对 误差 : 表示 输出 模型 的 平均 绝对 误差 统计 量 。 

。 最 大 绝对 误差 百分比 : 表示 输出 模型 的 最 大 绝对 误差 百分比 统计 量 ， 即 以 比例 形式 显示 最 
大 的 预测 误差 。 
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。 最 大 绝对 误差 : 表示 输出 模型 的 最 大 绝对 误差 统计 量 。 “最 大 绝对 误差 百分比 ”和 “最 大 
绝对 误差 ”主要 用 于 关注 模型 单个 记录 预测 误差 的 情况 。 
。 正 态 化 BIC: 表示 输出 标准 的 BIC 统计 量 ， 该 统计 量 基于 均 方 误差 统计 量 ， 并 考虑 模型 的 
参数 个 数 和 序列 数据 个 数 。 
@ “用 于 比较 模型 的 统计 ”选项 组 。 该 选项 组 用 于 设置 输出 比较 模型 的 统计 量 ， 包 含 以 
下 3 个 选项 : 
。 拟 合 优 度 :表示 将 每 个 模型 拟 合 优 度 的 统计 量 显示 到 一 张 表格 中 进行 比较 。 
。 残 差 自 相关 函数 : 表示 输出 模型 的 残 差 序列 的 自 相关 函数 及 百 分 位 点 。 
。 或 差 偏 自 相关 函数 : 表示 输出 模型 的 残 差 序列 的 偏 相关 函数 及 百 分 位 点 。 
@ “单个 模型 的 统计 ”选项 组 。 该 选项 组 用 于 对 个 别 模型 设置 输出 统计 量 ， 包 含 以 下 3 
个 选项 : 
。 参数 估算 值 : 表示 输出 模型 的 参数 估算 值 表 。 
。 残 差 自 相关 函数 : 表示 输出 模型 的 残 差 序列 的 自 相关 函数 及 置信 区 间 。 
。 残 差 偏 自 相 关 函 数 : 表示 输出 模型 的 残 差 序列 的 偏 相关 函数 及 置信 区 间 。 
@@ “显示 预测 值 ” 复 选 框 。 选 中 该 复 选 框 ， 表 示 显示 模型 的 预测 值 及 其 置信 区 间 。 
“图 ”设置 
单 击 “时 间 序列 建 模 器 ”对 话 框 中 的 “图 ”选项 卡 ， 如 图 15-12 所 示 。 


15-12 “图 ”选项 卡 


“图 ”选项 卡 主要 用 于 设置 输出 模型 拟 合 统计 量 、 自 相关 函数 以 及 序列 值 ( 包 括 预测 值 ) 
的 图 。 包 括 两 个 选项 组 : 

Q “用 于 比较 模型 的 图 ”选项 组 。 该 选项 组 用 于 设置 输出 所 有 模型 的 拟 合 统计 量 和 自 相 
关 函 数 的 图 ， 每 个 选项 分 别 生成 单独 的 图 。 可 输出 图 表 的 统计 量 有 : 平稳 R 方 、R 方 、 均 方 
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根 误差 、 平 均 绝 对 误差 百分比 、 平 均 绝对 误差 、 最 大 绝对 误差 百分比 、 最 大 绝对 误差 、 正 态 化 
BIC、 残 差 自 相关 函数 及 残 差 偏 自 相关 函数 。 

@ “单个 模型 的 图 ”选项 组 。 该 选项 组 用 于 设置 输出 单个 模型 的 拟 合 统计 量 和 自 相关 函 
数 的 图 。 只 有 选择 “序列 ” 复 选 框 方 可 获取 每 个 模型 的 预测 值 的 图 ， 图 中 所 显示 的 内 容 包 括 实 
测 值 、 预 测 值 、 拟 合 值 、 预 测 值 的 置信 区 间 及 拟 合 值 的 置信 区 间 。 

“输出 过 滤 ” 设 置 

单 击 “ 时 间 序 列 建 模 器 ”对 话 框 中 的 “输出 过 滤 ” 选 项 卡 ， 如 图 15-13 所 示 。 


15-13 “输出 过 滤 ” 选 项 卡 
“输出 过 滤 ” 选 项 卡 主要 用 于 设置 输出 的 模型 。 
选中 “在 输出 中 包括 所 有 模型 ” 单 选 按钮 , 表示 输出 结果 中 包含 所 有 设置 的 模型 。 选中 “ 根 
据 拟 合 优 度 过 滤 模型 ” 单 选 按钮 ， 表 示 仅 输出 满足 设置 的 拟 合 优 度 条 件 的 模型 。 只 有 在 选中 该 
单 选 按钮 的 情况 下 ，“ 显 示 ” 选 项 组 才 会 被 激活 。 
“显示 ”选项 组 用 于 设置 输出 模型 所 满足 的 拟 合 优 度 条 件 。 其 中 各 选项 含义 如 下 : 


。 最 佳 拟 合 模型 : 选中 该 复 选 框 ， 表示 输出 拟 合 优 度 最 好 的 模型 ， 可 以 设 定 满足 条 件 的 模型 
的 数量 或 百分比 。 
> 选择 “模型 的 固定 数目 ”表示 输出 固定 数量 的 拟 合 优 度 最 好 的 模型 ， 在 “数量 ”文本 
框 中 指定 模型 的 数目 ; 
> 选择 “ 占 模型 总 数 的 百分比 ”表示 输出 一 定 比例 于 总 数 的 拟 合 优 度 最 好 的 模型 ， 在 “ 百 
分 比 ” 文 本 框 中 指定 输出 的 百分比 。 
。 最 差 拟 合 模型 : 选中 该 复 选 框 ， 表示 输出 拟 合 优 度 最 差 的 模型 ， 可 以 设 定 满足 条 件 的 模型 
的 数量 或 百分比 。 
> 选择 “模型 的 固定 数目 ”表示 输出 固定 数量 的 拟 合 优 度 最 差 的 模型 ， 同 样 在 “数量 ” 
文本 框 中 指定 模型 的 数目 ; 
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> 选择 “ 占 模 型 总 数 的 百分比 ”表示 输出 一 定 比例 于 总 数 的 拟 合 优 度 最 差 的 模型 ， 并 在 
“百分比 ”文本 框 中 指定 输出 的 百分比 。 
。 拟 合 优 度 测量 : 该 下 拉 列 表 框 用 于 指定 衡量 模型 拟 合 优 度 的 具体 统计 量 ， 含 有 平稳 及 方 、 
及 方 、 均 方 根 误 差 、 平 均 绝对 误差 百分比 、 平 均 绝对 误差 、 最 大 绝对 误差 百分比 、 最 大 绝 
对 误差 及 正 态 化 BIC 统计 量 。 
“保存 ”设置 
单 击 “ 时 间 序 列 建 模 器 ”对 话 框 中 的 “保存 ”选项 卡 ， 如 图 15-14 所 示 。 
“保存 ”选项 卡 主要 用 于 将 模型 预测 值 另存 为 活动 数据 文件 中 的 新 变量 , 也 可 以 将 模型 规 
格 以 XML 格式 保存 到 外 部 文件 中 。 
@ “保存 变量 ”选项 组 。 该 选项 组 用 于 将 模型 预测 值 、 置 信 区 间 上 下 限 和 残 差 另存 为 活 
动 数据 集中 的 新 变量 。 


@O nns srss ems 


@O rnsHa rm REDIGREF (BsPss) FE 


CE 9 Ee ey ee 
图 15-14 “保存 ”选项 卡 

在 “描述 ”列表 中 有 四 类 保存 对 象 : 预测 值 、 置 信 区 间 上 限 、 置 信 区 间 下 限 和 噪声 残 值 。 
选中 每 一 类 保存 对 象 后 面 的 “保存 ” 复 选 框 就 可 以 保存 新 变量 。 只 有 选中 “保存 ” 复 选 框 后 ， 
“变量 名 前 级 ”才能 被 激活 并 可 更 改 。 另外， 如 果 预 测 期 超出 了 该 因 变 量 序列 的 长 度 ， 则 增加 
新 个 案 。 

@ “导出 模型 文件 ”选项 组 。 该 选项 组 用 于 将 所 有 估计 模型 的 模型 规格 都 以 XML 格式 
导出 到 指定 的 文件 中 。 可 以 在 “XML (PMML) 文件 ”文本 框 中 指定 文件 路 径 , 或 者 单 击 “ 浏 
览 ”按钮 打开 指定 文件 路 径 保存 文件 。 

“选项 ”设置 

单 击 “ 时 间 序 列 建 模 器 ”对 话 框 中 的 “选项 ”选项 卡 ， 如 图 15-15 所 示 。 

“选项 ” 选项 卡 主要 用 于 设置 预测 期 、 指 定 缺 失 值 的 处 理 方法 、 设 置 置信 区 间 宽 度 、 指 定 
模型 标识 前 组 以 及 设置 为 自 相 关 显 示 的 延迟 最 大 阶 数 。 


362 


第 15 章 ”时间 序列 模型 


| 


ACF 和 PACF 铺 出 中 加 未 的 最 大 现 返 种 09:。 世 4 


J ~» ea [nad aw) 


15-15 “选项 ”选项 卡 
@ “预测 期 ”选项 组 。 该 选项 组 主要 用 于 设 定 预测 期 间 ， 预 测 范围 共有 以 下 两 种 。 


。 “评估 期 结束 后 的 第 一 个 个 案 到 活动 数据 集中 的 最 后 一 个 个 案 ”: 选中 该 单 选 按 钮 ， 表 示 
预测 范围 从 模型 估计 期 所 用 的 最 后 一 个 数据 开始 到 活动 数据 集中 的 最 后 一 个 个 案 为 止 .一 
般 当 估计 模型 所 用 的 数据 并 非 全 部 数据 时 选择 此 项 ， 以 便 将 模型 预测 值 与 实际 值 进行 比 
较 ， 进 而 评估 模型 的 拟 合 情况 。 

。 “评估 期 结束 后 的 第 一 个 个 案 到 指定 日 期 之 间 的 个 案 ”: 选中 该 单 选 按钮 ， 表 示 预 测 范围 
从 模型 估计 期 所 用 的 最 后 一 个 数据 开始 到 用 户 指定 的 预测 期 为 止 ， 常用 来 预测 超过 当前 数 
据 集 的 时 间 范 围 的 个 案 。 在 “日 期 ”列表 框 中 指定 预测 范围 的 最 终日 期 。 如 果 已 经 定义 了 
时 间 变 量 ，“ 日 期 ”列表 框 中 就 会 显示 定义 的 日 期 格式 ; 如 果 没 有 定义 时 间 变 量 ，“ 日 期 ” 
列表 框 中 仅 会 显示 “实测 值 ”文本 框 ， 只 需要 在 其 中 输入 相应 的 记录 号 即 可 。 


@ “用 户 缺失 值 ” 选 项 组 。 该 选项 组 用 于 指定 缺失 值 的 处 理 方法 是 ， 有 以 下 两 个 选项 ; 


。 视 为 无 效 : 选中 该 单 选 按 钮 ， 表 示 把 缺失 值 当 作 系 统 缺 失 值 处 理 ， 视 为 无 效 数据 。 

。 视 为 有 效 : 选中 该 单 选 按钮 ， 表 示 把 缺失 值 视 为 有 效 数据 。 

@ “置信 区 间 宽 度 ” 文 本 框 。 该 文本 框 用 于 指定 模型 预测 值 和 残 差 自 相 关 的 置信 区 间 ， 
输入 范围 为 0 一 99 的 任何 正 数 ， 系 统 默认 95% 的 置信 区 间 。 

“输出 中 的 模型 标识 前 级 ”文本 框 。 该 文本 框 用 于 指定 模型 标识 前 级 。“ 变 量 ” 选 项 
卡 中 指定 的 每 个 因 变量 都 可 带 来 一 个 单独 的 估计 模型 , 且 模 型 都 用 唯一 名 称 区 别 , 名 称 由 可 定 
制 的 前 绥 和 整数 后 绥 组 成 。 

@ “ACF 和 了 PACF 输出 中 显示 的 最 大 延迟 数 ”文本 框 。 该 文本 框 用 于 指定 自 相关 函数 和 
偏 相 关 函 数 的 最 大 标签 数 。 


设置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 指数 平滑 法 建 模 
的 结果 。 
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15.2.3 ”实验 操作 


下 面 仍 以 数据 文件 “15-1” 为 例 , 讲解 指数 平滑 法 建 模 的 具体 操作 过 程 并 对 结果 进行 说 明 。 
1. 实验 数据 描述 


这 里 对 数据 文件 “15-1” 不 再 袭 述 。 本 节 利用 指数 平滑 法 对 联邦 基金 利率 差额 进行 拟 合 ， 
以 消除 非 正常 波动 ， 得 到 联邦 基金 利率 差额 在 48 年 中 稳定 长 期 的 走势 。 


2. 实验 操作 步骤 
具体 操作 步骤 如 下 : 


GES56i)) 打开 数据 文件 “15-1”， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “ 数 
据 ”|“ 定 义 日 期 和 时 间 ” 命 令 ， 打开“ 定义 日 期 ”对 话 框 ， 在 “个 案 是 ”列表 框 中 
选择 “年 ， 月 ”， 然 后 在 “第 一 个 个 案 是 ”选项 组 中 的 “年 ”和 “月 ”文本 框 中 输入 
数据 开始 的 具体 年 份 1960 和 月 份 1， 然 后 单 击 “ 确 定 ” 按 钮 ， 完 成 时 间 变 量 的 定义 。 

下 2 在 菜单 栏 中 选择 “分 析 ”|“ 时 间 序 列 预测 ”|“ 创 建 传统 模型 ”命令 ， 打 开 “ 时 间 序 
列 建 模 器 ”对 话 框 ， 将 “SPREAD ”变量 选 入 “ 因 变 量 ” 列 表 框 中 ， 在 “方法 ”下 拉 
列表 框 中 选择 “指数 平滑 法 ”选项 。 

下) 单 击 “条 件 ”按钮 ， 打 开 “ 时 间 序 列 建 模 器 : 指数 平滑 条 件 ”对 话 框 ， 选 中 “简单 
季节 性 ” 单 选 按钮 ， 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 。 

ES 单 击 “ 统 计 ” 选 项 卡 ， 选 择 “ 参 数 估算 值 ” 和 “显示 预测 值 ” 复 选 框 ， 然 后 单 击 “ 继 
续 ” 按 钮 ， 保 存 设 置 。 

GE565 单 击 “确定 ”按钮 ， 便 可 以 得 到 指数 平滑 法 建 模 的 结果 。 


3. 实验 结果 及 分 析 


在 SPSS Statistics 查看 器 窗口 得 到 指数 平滑 法 
建 模 的 结果 如 图 15-16~ 图 15-20 所 示 。 模型 天 型 

图 15-16 给 出 了 模型 的 基本 描述 , 从 中 可 以 看 TD ”US pread | 简 站 季节 性 
出 所 建立 的 指数 平滑 法 的 因 变 量 标签 是 “US 
spread”， 模 型 名 称 为 “模型 1”， 模 型 的 类 型 为 
简单 季节 性 。 

图 15-17 给 出 了 模型 的 八 个 拟 合 优 度 指 标 ， 以 及 这 些 指标 的 平均 值 、 最 小 值 、 最 大 值 及 百 
分 位 数 。 其 中 ,平稳 及 方 值 为 0.556， 而 及 方 值 为 0.898， 这 是 由 于 因 变 量 数据 为 季节 性 数据 ， 
因此 平稳 RR 方 更 具有 代表 性 。 从 两 个 RR 方 值 来 看 ， 该 指数 平滑 法 的 拟 合 情况 比较 良好 。 

15-18 给 出 了 模型 的 拟 合 统计 量 和 杨 - 博 克 斯 Q 统计 量 。 平 稳 R 方 值 为 0.556， 与 模型 
拟 合 图 中 的 平稳 及 方 一 致 。 杨 -博克 斯 Q 统计 量 值 为 123.819， 显 著 性 为 0.000， 因 此 拒绝 残 差 
序列 为 独立 序列 的 原 假设 , 说 明 模型 拟 合 后 的 残 差 序列 是 存在 自 相关 的 , 建议 采用 ARIMA 模 
型 继续 拟 合 。 


模型 描述 


图 15-16 模型 描述 


364 


第 15 章 ”时间 序列 模型 


模型 拟 合 度 
位 数 
拟 台 统计 平均 值 标准 误差 ”好 小 便 最 大 全 5 10 25 50 75 90 95 
二 让 R 广 556 556 556 556 556 556 556 555 556 556 
R 方 .898 B98 .898 898 .898 B98 898 898 898 898 
RMSE 540 540 540 540 540 540 540 540 540 540 
NAPE 65.733 65.733 65.733 65.733 65.733 65.733 65.733 65.733 65.733 65.733 
NDAPE ~ 4035809 4035809 4035809 4035809 4035809 4035809 4035809 4035809 4035809 4035809 
WAE 316 316 316 316 316 316 316 316 316 316 
MaxAE 5291 5.291 5291 5291 5.291 5291 5291 5.291 5291 5291 
Eee -1211 | | -al 2 2 -2 2 2 2 | 1 
图 15-17 模型 拟 合 度 
模型 统计 
模型 寥 合 度 统 
计 杨 情 克 所 Q(18) 
模型 预测 变 站 数 。 ”六 黎民 广 蒂 计 DF 显 车 性 离 研 全 数 
US spread 借 型 1 0 556 123.819 16 000 0 


15-18 ”模型 统计 量 
图 15-19 给 出 了 指数 平滑 法 模型 参数 估算 值 列表 , 从 中 可 以 看 到 本 实验 拟 合 的 指数 平滑 法 
的 水 平 Alpha 值 为 0.999, 显著 性 为 0.00, 不 仅 作用 很 大 而 且 非 常 显著 。 而 季节 Delta 值 为 0.001， 
该 值 不 仅 很 小 而 且 没 有 显著 性 ， 因 此 可 以 判断 SPREAD 尽管 为 季节 性 数据 ， 但 该 序列 几乎 没 
有 任何 季节 性 特征 。 


指数 平滑 法 模型 参数 
本 型 估算 | 标准 殿 关 t 显著 性 
US spread- 模 型 -1 。 不 转换 。 Alpha 《水 于) 999 042 24018 000 
Delta (季节 ) 001 12291 5.429E-5 1.000 


15-19 ”指数 平滑 法 模型 参数 


图 15-20 给 出 了 SPREAD 的 指数 平滑 法 的 拟 合 图 和 观测 值 。SPREAD 序列 整体 上 成 波动 
状态 ， 拟 合 值 和 观测 值 曲线 在 整个 区 间 中 几乎 重合 ， 因 此 可 以 说 明 指数 平滑 法 对 SPREAD 的 
拟 合 情 况 非 常 良好 。 通 过 指数 平滑 法 的 拟 合 图 ， 我 们 可 以 发 现 联邦 基金 利率 差额 在 48 年 中 出 
现 过 两 次 剧烈 波动 下 行 ， 并 且 总 体 上 前 二 十 年 波动 较为 剧烈 ， 而 最 近 二 十 年 波动 相对 平缓。 


家 提 


4 


2 


Number 


[ELE 


五 五 五 一 = -为 五 如 五 丸 九 五 
万 身 硼 万 身 坟 万 和 再 户 么 再 万 血 至 三 务 再三 身 笃 马 血 再 万 秀 青 育 在 
EEEEEEEEEEEEED EE 


15-20 SPREAD 模型 
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15.3 ARIMA 模型 


ARIMA 模型 是 时 间 序 列 分 析 中 常用 的 模型 之 一 ，ARIMA 模型 提供 了 一 套 有 效 的 预测 技 
术 ， 在 时 间 序 列 预测 中 具有 广泛 的 应 用 。 


15.3.1 ARIMA 模型 的 基本 原理 


ARIMA 模型 又 称 自 回 归 移 动 平均 模型 。 它 是 指 将 非 平稳 时 间 序 列 转化 为 平稳 时 间 序 列 ， 
然后 将 因 变量 仅 对 它 的 灌 后 值 及 随机 误差 项 的 现 值 和 灌 后 值 进行 回归 所 建立 的 模型 。ARIMA 
模型 将 预测 指标 随时 间 推 移 而 形成 的 数据 序列 看 作 是 一 个 随机 序列 ,这 组 随机 变量 所 具有 的 依 
存 关系 体现 着 原始 数据 在 时 间 上 的 延续 性 ， 它 既 受 外 部 因素 的 影响 ， 又 有 自身 变动 规律 。 
ARIMA (p,q) 模型 的 数学 表达 式 如 公式 〈15-1) 所 示 : 

yi = 六 wy， + 六 5e (15-1) 


其 中 ， 参 数 & 为 自 回 归 参 数 ，5, 为 移动 平均 参数 ， 是 模型 的 待 估计 参数 。 


15.3.2 ARIMA 模型 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 建立 ARIMA 模型 。 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 预 测 ”| “创建 模 型 ”命令 ， 打 开 如 图 15-21 所 示 的 “时 间 
序列 建 模 器 ”对 话 框 。 

2) 选择 变量 和 方法 。 

从 源 变量 列表 框 中 选择 建立 ARIMA 模型 的 因 变 量 , 将 其 选 入 “ 因 变 量 ” 列 表 框 中 。 在 “ 方 
法 ”下 拉 列 表 框 中 选择 “ARIMA”, 然后 单 击 “和 条件” 按钮， 打开 “时 间 序 列 建 模 器 : ARIMA 
条 件 ” 对 话 框 ， 如 图 15-22 所 示 。 


起 时 站 卫 本 莱 ，ARIMA 条 件 x 


当前 发 度 : 无 


| EGE 
15-21 “了 时间 序 列 建 模 器 ”对 话 框 15-22 “时 间 序 列 建 模 器 : ARIMA 条 件 ” 对 话 框 
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“模型 ”选项 卡 
“时 间 序 列 建 模 器 : ARIMA 条 件 ” 对 话 框 中 的 “模型 ”选项 卡 用 于 指定 ARIMA 模型 的 
结构 和 因 变 量 的 转换 ， 包 括 以 下 几 个 部 分 


中 “结构 ? 表 该 网 络 列表 用 于 指定 ARIMA 模型 的 结构 , 在 相应 的 单元 格 中 输入 ARIMA 
模型 的 各 个 成 分 值 ， 所 有 值 都 必须 为 非 负 整 数 。 对 于 “ 自 回 归 ” 和 “移动 平均 值 ”的 数值 表示 
最 大 阶 数 ， 同 时 模型 中 将 包含 所 有 正 的 较 低 阶 。 


。 “ 非 季节 性 ” 列 该 列 中 的 “ 自 回归 ”文本 框 用 于 输入 ARIMA 中 的 自 回 归 AR 阶 数 ， 即 
在 ARIMA 使 用 序列 中 的 哪 部 分 值 来 预测 当前 值 ; “ 差 值 ”文本 框 用 于 输入 因 变 量 序列 差 
分 的 阶 数 ， 主 要 是 为 了 使 非 平稳 序列 平稳 化 以 满足 ARIMA 模型 平稳 的 需要 ; “移动 平均 
值 ” 文 本 框 用 于 输入 ARIMA 中 的 移动 平均 MA 阶 数 ， 即 在 ARIMA 中 使 用 哪些 先前 值 的 
序列 平均 数 的 偏差 来 预测 当前 值 。 

。 “季节 性 ” 列 只 有 在 为 活动 数据 集 定义 了 周期 时 ， 才 会 启用 “季节 性 ” 列 中 的 各 个 单元 
格 。 在 “季节 性 ” 列 中 ， 季 节 性 自 回归 成 分 、 移 动 平均 数 成 分 和 差分 成 分 与 其 非 季节 性 对 
应 成 分 起 着 相同 的 作用 。 对 于 季节 性 的 阶 ， 由 于 当前 序列 值 受 以 前 的 序列 值 的 影响 ， 序 列 
值 之 间 间 隔 一 个 或 多 个 季节 性 周期 。 如 对 于 季度 数据 ( 季节 性 周期 为 4) ， 季 节 性 1 阶 表 
示 当 前 序列 值 受 自 当前 周期 起 4 个 周期 之 前 的 序列 值 的 影响 。 因 此 ， 对 于 季度 数据 ， 指 定 
季节 性 1 阶 等 同 于 指定 非 季 节 性 4 阶 。 


@ “转换 ”选项 组 。 该 选项 组 用 于 对 因 变 量 进 se 
行 转换 ， 包 含 以 下 3 个 选项 。 


。 无 : 表示 不 对 因 变 量 序列 进行 任何 转换 。 
。 平方 根 : 表示 对 因 变 量 序列 取 平方 根 参与 建 模 。 
。 自然 对 数 : 表示 对 因 变 量 序列 取 自 然 对 数 参与 
建 模 。 
@ “在 模型 中 包括 常量 ” 复 选 框 。 该 复 选 框 表 
示 在 ARIMA 中 包含 常量 项 ， 但 是 当 应 用 差分 时 ， 建 
议 不 包含 常数 。 


“ 离 群 值 ”选项 卡 
单 击 “ 时 间 序列 建 模 器 : ARIMA 条 件 ” 对 话 框 
中 的 “ 离 群 值 ”选项 卡 ， 如 图 15-23 所 示 。 15-23 “ 离 群 值 ”选项 卡 


“ 离 群 值 ” 选 项 卡 主要 用 于 对 离 群 值 进行 设置 ， 有 3 种 方式 : 


中 “不 检测 离 群 值 ， 也 不 为 其 建 模 ”: 表示 不 检测 离 群 值 或 为 其 建 模 ， 该 选项 为 默认 选项 。 

@ “自动 检测 离 群 值 ”: 表示 要 自动 检测 离 群 值 ， 并 选择 检测 离 群 值 类 型 。 在 “要 检测 
的 离 群 值 类 型 ”中 选择 检测 类 型 ， 有 以 下 几 个 可 选择 的 项 。 

。 加 性 : 表示 自动 检测 单个 观测 记录 的 异常 值 。 

。 水 平 变 动 : 表示 自动 检测 数据 水 平移 动 引 起 的 异常 值 。 

。 革新 : 表示 自动 检测 由 噪声 冲击 引起 的 异常 值 。 
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。 瞬 态 : 表示 自动 检测 对 其 后 观测 值 影响 按 指数 衰减 至 0 的 异常 值 。 

。 季节 加 性 : 表示 自动 检测 周期 性 的 影响 某 固定 时 刻 的 异常 值 ， 如 月 度数 据 的 一 月 效应 。 

。 局 部 趋势 : 表示 自动 检测 导致 局 部 线性 趋势 的 异常 值 ， 往 往 该 异常 值 以 后 的 数据 呈 线 性 趋势 。 
。 加 性 修补 : 表示 自动 检测 两 个 以 上 连续 出 现 的 “加 性 ”异常 值 。 


@ “将 特定 时 间 点 作为 离 群 值 进行 建 模 ”: 表示 指定 特定 的 时 间 点 作为 离 群 值 。 其 中 ， 


每 个 离 群 值 在 “ 离 群 值 定义 ”网 格 中 占 单独 的 一 行 。 在 指定 的 日 期 格式 中 输入 特定 时 间 点 ， 如 
在 “年 ”和 “月 ”中 输入 特定 时 间 点 的 具体 年 份 和 月 份 ; 在 “类 型 ”下 拉 列 表 框 中 选择 离 群 值 
的 具体 类 型 。 其 中 ， 离 群 值 的 类 型 与 “要 检测 的 离 群 值 类 型 ”中 提供 的 类 型 一 致 。 


3) 进行 相应 的 设置 。 
建立 ARIMA 模型 所 用 的 “时 间 序 列 建 模 器 ”对 话 框 与 建立 指数 平滑 法 相同 ， 在 此 不 再 袭 述 。 
设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 ARIMA 模型 建 


模 的 结果 。 


15.3.3 ”实验 操作 


下 面 将 以 数据 文件 “15-3” 为 例 , 讲解 指数 平滑 法 建 模 的 具体 操作 过 程 并 对 结果 进行 说 明 。 
1. 实验 数据 描述 
数据 文件 “15-3” 与 所 用 数据 文件 “15-1” 相 同 ， 利 用 ARMA 模型 分 析 对 美国 10 年 期 国 


库 券 利率 与 联邦 基金 利率 差额 的 走势 进行 分 析 与 预测 。 
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2. 实验 操作 步骤 
具体 操作 步骤 如 下 : 


于 TY 打开 “15-3” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “ 数 
据 ”|“ 定 义 日 期 和 时 间 ” 命 令 ， 打开“ 定义 日 期 ”对 话 框 ， 在 “个 案 是 ”列表 框 中 
选择 “年 ， 月 ”， 然 后 在 “第 一 个 个 案 是 ”选项 组 中 的 “年 ”和 “月 ”文本 框 中 输入 
数据 开始 的 具体 年 份 1960 和 月 份 1， 然 后 单 击 “ 确 定 ” 按 钮 ， 完 成 时 间 变 量 的 定义 。 

6 本 在 菜单 栏 中 选择 “分 析 ”|“ 时 间 序 列 预测 ”|“ 创 建 传统 模型 ”命令 ， 打 开 “ 时 间 序 
列 建 模 器 ”对 话 框 ， 将 “SPREAD ”变量 选 入 “ 因 变 量 ” 列 表 框 中 ， 在 “方法 ”下 拉 
列表 框 中 选择 “ARIMA ”。 

下 03 单 击 “ 条 件 ” 按 钮 ， 打 开 “ 时 间 序 列 建 模 器 : ARIMA 条 件 ” 对 话 框 ， 单 击 “ 模 型 ” 选 
项 卡 ， 在 “ 自 回 归 ” 的 “季节 性 ” 列 中 输入 “3”， 在 “ 差 值 ”的 “季节 性 ” 列 中 输入 

“1”， 在 “移动 平均 值 ” 的 “季节 性 ” 列 中 输入 “2”， 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 。 

(GE364 单 击 “ 统 计 ” 选 项 卡 ， 选 择 “参数 估算 值 ” 和 “显示 预测 值 ” 复 选 框 ， 然 后 单 击 “ 继 
续 ” 按 钮 ， 保 存 设 置 。 

GES65 单 击 “确定 ”按钮 ， 便 可 以 得 到 ARIMA 模型 建 模 的 结果 。 


3. 实验 结果 及 分 析 
在 SPSS Statistics 查看 器 窗口 得 到 ARIMA 模型 建 模 的 结果 如 图 15-24~ 图 15-27 所 示 。 
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图 15-24 给 出 了 模型 的 基本 描述 ， 从 中 可 以 看 出 所 模型 描述 
建立 的 ARIMA 模型 的 因 变量 标签 是 “US spread”， 模 LE 
型 名 称 为 “模型 1”， 模 型 的 类 型 为 ARIMA (3,1,2) 。 [ED USspead 1 名 的 000 
图 15-25 给 出 了 模型 的 八 个 拟 合 优 度 指标 的 平均 
值 、 最 小 值 、 最 大 值 以 及 百 分 位 数 。 从 两 个 及 方 值 来 看 ， 
ARIMA (3,1.2) 的 拟 合 情 况 良好 ， 其 中 ， 平 稳 及 方 值 为 0.324， 而 及 方 值 为 0.168， 这 是 由 于 
因 变量 数据 为 季节 性 数据 ， 因 此 平稳 RR 方 更 具有 代表 性 。 


15-24 ”模型 描述 


模型 拟 合 度 
百 分 位 数 

家 全 六 均值 标准 误 闫 。 划 小 入 最 大 值 5 10 25 50 75 90 95 
区 工 玉 324 324 324 324 324 324 .324 324 324 324 
R 方 168 168 168 168 168 168 168 168 168 168 
RMSE 1559 1.559 1.559 1.559 1.559 1.559 1.559 1.559 1.559 1.559 
MAFE 238.164 238164 238164 238164 238164 2381464 238164 238.164 238164 238.164 
MaxAPE 14706.550 14706.550 14706.550 14706.550 14706.550 14706.550 14706.550 14706.550 14706.550 14706.550 
MAE 1199 ' 1199 1.199 1199 1.199 1499 1.199 1.4199 1.199 1.199 
MaxAE 6601 6.601 6.601 6.601 6.601 6.601 6.601 6.601 6601 6.601 
1 化 Blc 955 .955 955 955 955 955 .955 .955 955 .955 


图 15-25 ”模型 拟 合 度 


图 15-26 给 出 了 ARIMA (3,1,2) 模型 参数 估计 值 。ARIMA (3,1,2) 中 有 两 部 分 : AR 和 
MA。 其 中 AR 自 回归 部 分 的 三 项 显著 性 水 平分 别 为 0.527、0.554、0.242。 


ARIMA 模型 参数 
估算 标准 误 关 t 显 车 性 

US spread- 模 各 -1 US spread 不 特 扫 。 常生 027 006 4.389 000 
AR,， 季节 人 性。 闫 巡 1 -.378 596 -.634 527 
延 过 2 175 295 591 554 
延迟 3 -.194 166 -1.170 242 

季节 性 浆 由 1 
MA， 季 节 性 。 迁 妈 1 137 12.928 011 992 
延 巡 2 863 11.120 078 938 


15-26 ”ARIMA 模型 参数 


图 15-27 给 出 了 SPREAD 

的 ARIMA (3,1,2) 模型 的 拟 合 
图 和 观测 值 。SPREAD 序列 整 
体 上 呈 波 动 状态 , 拟 合 值 和 观测 
值 曲线 在 整个 区 间 整 体 上 拟 合 
情况 良好 ,但 是 明显 可 以 看 出 拟 。 * 

合 值 的 波动 性 要 小 于 实际 观察 ”。 

值 。 因 此 可 以 说 明 ARIMA ”am rrrrrrrrrrrrrrrrrrrrrrrrrrrrrr 
(3,1,2) 模型 对 SPREAD 的 拟 
合 情 况 一 般 ,需要 进一步 探索 其 
他 的 ARIMA 模型 。 


Number 


[EL 


图 15-27 SPREAD 模型 
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15.4 季节 性 分 解 模型 
15.4.1 季节 性 分 解 的 基本 原理 


季节 变动 趋势 是 时 间 序 列 的 4 种 主要 变动 趋势 之 一 ,所 谓 季节 性 变动 是 指 由 于 季节 因素 导 
致 的 时 间 序 列 的 有 规则 变动 。 引 起 季节 变动 的 除 自然 原因 外 ,还 有 人 为 原因 ， 如 节假日 、 风 俗 
习惯 等 。 季 节 性 分 解 的 主要 方法 包括 按 月 〈 季 ) 平均 法 和 移动 平均 趋势 剔除 法 。 


15.4.2 ”季节 性 分 解 的 SPSS 操作 
打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 


后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 中 进 | = : 
行 季节 性 分 解 操作 。 人 YEAR notpenogc[ 


of NONTH, period 121 


1) 在 菜单 栏 中 选择 “分 析 ”|“ 时 间 序 列 预测 ” 
1“ 季节 性 分 解 ”命令 , 打开 如 图 15-28 所 示 的 “ 季 
节 性 分 解 ” 对 话 框 。 

2) 选择 变量 。 

从 源 变 量 列表 框 中 选择 进行 季节 性 分 解 的 时 间 
序列 , 然后 单 击 国 按 钮 将 其 选 入 “变量 ”列表 框 中 。 
“变量 ”列表 框 中 的 变量 必须 为 数值 型 的 度量 变量 ， 
且 至 少 定义 一 个 周期 性 时 间 变 量 。 15-28 “季节 性 分 解 ”对 话 框 

3) 进行 相应 的 设置 。 

“模型 类 型 ”设置 

该 选项 组 用 于 指定 季节 性 分 解 的 模型 类 型 , SPSS 提供 了 两 种 常用 的 分 解 模 型 : 乘 性 和 加 性 。 

“移动 平均 值 权重 ”设置 

该 选项 组 用 于 指定 计算 移动 平均 数 时 的 权重 。 “所 有 点 相等 ”表示 使 用 等 于 周期 的 跨度 及 
所 有 权重 相等 的 点 来 计算 移动 平均 数 ， 该 方法 适用 于 周期 为 奇数 的 序列 。“ 端 点 按 0.5 加 权 ” 
使 用 等 于 周期 加 1 的 跨度 及 以 0.5 加 权 跨 度 的 端点 计算 序列 的 移动 平均 数 , 该 方法 适用 于 具有 


偶数 周期 的 序列 。 
“显示 个 案 列 表 ” 
该 复 选 框 表示 输出 每 个 个 案 的 季节 性 分 解 的 结果 。 
“保存 ”设置 
单 击 “ 保 存 ” 按 钮 ， 弹 出 如 图 15-29 所 示 的 “季节 : 保 
存 ” 对 话 框 。 


“季节 : 保存 ”对 话 框 主要 用 于 设置 保存 新 创建 的 变量 。 图 15-29 “季节 : 保存 ”对 话 框 


。 添加 到 文件 : 表示 将 季节 性 分 解 产生 的 新 变量 保存 到 当期 数据 集中 ， 新 变量 名 由 字母 前 
缓 、 下 画 线 和 数字 组 成 。 
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。 替换 现 有 项 : 表示 由 季节 性 分 解 创建 的 新 变量 序列 在 活动 数据 集中 保存 为 临时 变量 , 同时 ， 
将 删除 由 “预测 ”过 程 创建 的 任何 现 有 的 临时 变量 。 
。 不 创建 : 表示 不 向 活动 数据 集 添加 新 序列 。 


设置 完毕 后 , 单 击 “ 确 定 ” 按 钮 , 即 可 在 SPSS Statistics 查看 器 窗口 得 到 季节 性 分 解 的 结果 。 


15.4.3 ”实验 操作 


下 面 将 以 数据 文件 “15-4” 为 例 ， 讲 解 季节 性 


分 解 的 具体 操作 过 程 并 对 结果 进行 说 明 。 生生 | EY | 
SE al 


1. 实验 数据 描述 


数据 文件 “15-4” 记 录 了 从 1995 年 到 1999 年 | 有 
申 国 某 城 市 的 月 度 平 均 气 温 。 本 实验 将 利用 季节 性 可 5 FE CC) a Co tn C0) 90 Co) 00 CG | 
分 解 对 该 城市 气温 进行 分 析 , 利 用 季节 分 解 分 析 气 |2 Em 


) 

温 除去 季节 因素 影响 外 的 内 在 规律 。 数 据 文件 | 车 2 
“15-4” 的 原始 Excel 数据 文件 如 图 15-30 所 示 。 | 3 
在 SPSS 变量 视图 中 建立 变量 “气温 ”， 用 来 [3 全 
表示 中 国 某 城市 的 月 度 平均 气温 , 为 度量 变量 , 如 
图 15-31 所 示 。 -6 
然后 在 SPSS 活动 数据 文件 的 数据 视图 中 , 把 
相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 数 


据 如 图 15-32 所 示 15-30 “15-4” 数 据 文件 原始 文件 
Mp5 5atstcs ARE | | Stns RE ee 


文件 全 二 用) 下 看 o0 圾 据 [D) 转 执 四 分析 直 交 山本 MG) 天 及 序 (UU) 六 知 Q 窗口 OY) 基 助 t | | 妆 件 下 二 E) 坦 看 才 据 D) 外 办 CD 分 析 (自负 Mu) BG) 实用 程序 WU) 扩 曲 0 页 口 ON) 如 地) 


SPSS Sichc 允 天 二 [ Unicods ON| | | 


图 15-31 “15-4” 数 据 文件 的 变量 视图 图 15-32 “15-4” 数 据 文件 的 数据 视图 
2. 实验 操作 步骤 
有 具体 操作 步骤 如 下 : 


6 本 07 打开 数据 文件 “15-4”， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “ 数 
据 ”|“ 定 义 日 期 和 时间” 命令 ， 打 开 “ 定 义 日 期 ”对 话 框 ， 在 “个 案 是 ”列表 框 中 
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选择 “年 ， 月 ”然后 在 “第 一 个 个 案 是 ”选项 组 的 “年 ”和 “月 ”文本 框 中 输入 数 
据 开始 的 具体 年 份 1995 和 月 份 1， 然 后 单 击 “ 确 定 ” 按 钮 ， 完 成 时 间 变 量 的 定义 。 

人 ES62 在 菜单 栏 中 选择 “分 析 ”|“ 时 间 序 列 预测 ”|“ 季 节 性 分 解 ”命令 ， 打 开 “ 季 节 性 分 
解 ” 对 话 框 ， 将 “气温 ”变量 选 入 “变量 ”列表 框 中 ， 选 择 “加 性 ”和 “端点 按 0.5 
加 权 ” 单 选 按钮 。 

GE563 单 击 “确定 ”按钮 ， 便 可 以 得 到 季节 性 分 解 的 结果 。 

3. 实验 结果 及 分 析 


在 SPSS Statistics 查 看 器 窗口 中 得 到 指数 平滑 法 建 模 的 结果 如 图 15-33~ 图 15-35 所 示 。 

15-33 给 出 了 模型 的 基本 描述 , 从 中 可 以 看 出 模型 的 名 称 为 MOD_1, 模型 的 类 型 为 “加 
性 ”， 另 外 ， 还 可 以 看 到 移动 平均 数 的 计算 方法 。 

图 15-34 给 出 了 “气温 ?序列 进行 季节 性 分 解 的 季节 性 因素 。 季节 因子 
因为 季节 性 因素 的 存在 使 得 气温 在 不 同 的 月 份 呈现 出 相似 的 性 MY 称 和 总 
质 ， 因 此 该 季节 性 因素 相当 于 周期 内 季节 性 影响 的 相对 数 。 可 -时 


. 1 -15.86007 
见 ， 在 每 年 的 1、2、3、11、12 月 份 的 季节 性 因素 为 负 值 ， 使 2 -11.63507 
得 这 5 个 月 份 的 气温 相对 较 低 。 3 -6.20694 
4 1.51389 
模型 描述 5 7.24826 
模型 名 称 MOD_1 6 11.76910 
EE 加 性 7 13.50556 
序列 名 称 1 气温 8 12.23889 
系 节 性 周期 长 度 12 9 7.14306 
移动 于 均值 的 计算 方法 跨度 等 于 周期 长 度 加 10 1.07639 
. 唤起 
2 且 簿 点 按 0.5 加 11 -7.61736 
正在 应 用 来 自 MOD_1 的 模型 指定 项 12 -13.17569 
图 15-33 ”模型 描述 图 15-34 季节 性 因素 
图 15-35 给 出 了 “气温 ”序列 进行 季节 [sosmen pas ens ci nnnn SS 


性 分 解 后 的 数据 文件 的 变量 视图 。 从 该 图 可 = FE 一 一 一 
以 看 到 数据 文件 中 增加 了 4 个 序列 : J 站 ey 
ERR 1、SAS 1、SAF 1 和 STC 1。 其 中 ， 


ERR_1 表示 “气温 ”序列 进行 季节 性 分 解 et 
后 的 不 规则 或 随机 波动 序列 ，SAS_1 表示 上 i 
“气温 ”序列 进行 季节 性 分 解除 去 季节 性 因 已 - se 
素 后 的 序列 ，SAF_1 表示 “气温 ”序列 进行 ”| ee 
季节 性 分 解 产生 的 季节 性 因素 序列 , STC 1 上 tw) 537 7mw 


表示 “气温 ”序列 进行 季节 性 分 解 出 来 的 序 ”加 | 
列 趋势 和 循环 成 分 。 |" ii E ee 


图 15-35 “15-4” 数 据 文件 的 数据 视图 
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15.5 上 机 题 


| 视频 文件 ，\Wwideo\ 上 机 是 教学 视频 \chap15.wmv 
Fs 
Em 


15.1 调查 者 记录 了 某 旅游 景点 从 1999 年 1 月 到 2002 年 12 月 的 门票 收入 数据 。 部 分 相 
关 数 据 如 下 表 所 示 〔 数 据 路 径 ， 视 频 文件 sample\ 上 机 题 \chap15\ 习 题 \ 第 15 章 第 一 题 .sav)。 


视频 文件 ，\sample\ 上 机 题 \chap15\... 


年 份 月 份 门票 收入 (万 ) 
1999 1 70 
1999 2 93 
1999 3 60 
1999 4 72 
1999 要 125 
1999 6 89 
1999 7 101 
1999 8 112 
1999 9 97 


(1) 试 对 该 数据 定义 时 间 变 量 ， 时 间 频 率 为 月 度数 据 。 
(2) 对 该 数据 进行 平稳 化 处 理 。 


15.2 利用 15.1 的 门票 收入 数据 ， 试 对 该 数据 做 进一步 分 析 〈 数 据 路 径 : 视频 文件 
\sample\ 上 机 题 \chap15\ 习 题 \ 第 15 章 第 二 题 .sav) 。 


(1) 试 建立 季节 分 解 模 型 ， 提 取 该 数据 的 季节 性 因素 。 

(2) 建立 季节 分 解 模型 后 ， 同 时 提取 该 数据 的 随机 因素 ， 并 保持 到 原 数据 文件 。 

15.3 ”数据 文件 是 某 种 粒子 不 同时 间 的 相对 位 置 的 数据 。 试 建立 ARIMA 模型 对 该 粒子 的 
位 置 进行 分 析 与 预测 。 部 分 相关 数据 如 下 表 所 示 数据 路 径 : 视频 文件 \sample\ 上 机 题 \chap15\ 
习题 \ 第 15 章 第 三 题 .sav) 。 


观测 标号 粒子 位 置 
-0.874703053557 


0.120875517627 


0.098626037369 


0.499506645468 


-1.142634716899 


1 
2 
Fi 
4 
6 


1.204957757421 
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( 续 表 ) 
观测 标号 粒子 位 置 
时 -0.553879059446 
8 1.198701786761 
全 -0.104750836952 
10 2.978790677855 
11 1.398217367400 
12 1.612930009650 
13 1.751180547841 
14 1.690387218546 


-1.036817448796 


(1) 采用 ARIMA 模型 分 析 拟 合 粒子 的 相对 位 置 走 势 。 
(2) 绘制 ARIMA 模型 的 拟 合 图 和 观测 值 图 表 。 


15.4 ”本 题目 给 出 了 1978~1998 年 我 国 钢铁 产量 的 数据 ,数据 来 源 于 《中 国 工业 经 济 统计 
年 鉴 》， 试 用 指数 平滑 法 分 析 拟 合 钢铁 产量 的 稳定 长 期 的 走势 。 部 分 数据 如 下 表 所 示 (数据 路 
径 : 视频 文件 \sample\ 上 机 题 \chap15\ 习 题 \ 第 15 章 第 四 题 .sav) 。 


年 份 钢铁 产量 〈 百 万 吨 ) 
1978 676 
1979 825 
1980 774 
1981 716 
1982 940 
1983 1159 
1984 1384 
1985 1524 


(1) 采用 指数 平滑 法 分 析 拟 合 钢铁 产量 的 稳定 长 期 的 走势 。 
(2) 绘制 指数 平滑 法 的 拟 合 图 和 观测 值 图 表 。 
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生存 分 析 主 要 用 于 对 涉及 一 定时 间 发 生 和 持续 长 度 的 时 间 数 据 的 分 析 。 生 存 分 析 是 目前 统 
计 学 的 热门 , 自 20 世纪 70 年 代 中 期 以 来 , 生存 分 析 无 论 是 在 理论 还 是 应 用 方面 都 受到 了 人 们 
的 重视 ， 得 以 迅速 发 展 。 


16.1 生存 分 析 简 介 


生存 分 析 目 前 已 广泛 应 用 在 医学 、 生 物 学 、 公 共 健 康 、 金 融 学 、 保 险 和 人 口 统计 等 诸多 领 
域 ， 它 涉及 数理 统计 中 原 有 的 参数 统计 和 非 参 数 统计 的 结合 ， 以 及 一 些 较 深 、 较 新 的 概率 和 其 
他 数学 工具 。1986 年 美国 国家 科学 委员 会 提出 的 数学 发 展 概况 中 ， 曾 把 生存 分 析 列 为 六 大 发 
展 方向 之 一 。 


1. 生存 分 析 的 基本 概念 
生存 分 析 过 程 涉及 调查 对 象 的 生存 时 间 及 状态 等 ， 该 过 程 的 常用 概念 介绍 如 下 。 


(1) 生存 时 间 

广义 的 生存 时 间 是 指 从 某 个 起 始 事件 开始 , 到 某 个 终点 事件 的 发 生 所 经 历 的 时 间 , 也 称 为 
失效 时 间 。 生 存 时 间 的 特点 有 : 分 布 类 型 不 确定 ， 一 般 不 服从 正 态 分 布 ; 影响 生存 时 间 的 因素 
较为 复杂 ， 而 且 不 易 控 制 。 


(2 ) 生存 概率 
生存 概率 表示 某 单位 时 段 开 始 时 , 存活 的 个 体 到 该 时 段 结束 时 仍 存活 的 可 能 性 。 计算 公式 
为 : 生存 概率 = 活 满 某 时 段 的 人 数 /该 时 段 期 初 观察 人 数 =1-- 死 亡 概 率 。 

(3) 生存 函数 

又 称 为 累计 生存 概率 ， 即 将 时 刻 t 尚 存活 看 成 是 前 t 个 时 段 一 直 存活 的 累计 结果 。 用 公式 
表示 为 式 (16-1) : 


S()=P(X >D)=1-P(X<D)=1-F(0)=1/(00 (16-1) 


其 中 ，F(D 为 分 布 函数 ， SCt) 又 称 为 可 靠 度 函数 或 可 靠 度 ，f() 为 工 的 分 布 密度 函数 。 
(4) 危险 率 函 数 
指 1 时 刻 存活 ， 在 二 1+At 时 刻 内 死亡 的 条 件 概率 ， 用 w(D) 表示 ， 计 算 公式 为 式 (16-2) : 


A A) a 
1I-FO SO SO 


el (0)de : 


男 


此 ，SC) = 
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2. 生存 分 析 数 据 类 型 


生存 分 析 所 用 的 数据 通常 称 为 生存 数据 , 用 于 度量 某 时 间 发 生前 所 经 历 的 时 间 长 度 。 生存 
数据 按照 观测 数据 所 提供 的 信息 的 不 同 ， 可 以 分 为 完全 数据 、 删 失 数 据 和 截 尾数 据 3 种 。 


(1) 完全 数据 

完全 数据 是 指 提供 了 完整 信息 的 数据 。 如 研究 人 的 生存 状况 , 若 某 个 人 从 进入 研究 一 直到 
死亡 都 在 我 们 的 观测 之 中 ， 就 可 以 知道 其 准确 的 死亡 时 间 ， 这 个 生存 数据 就 是 一 个 完全 数据 。 
SPSS 中 通常 把 完全 数据 的 示 性 函数 取 值 为 0。 


(2) 删 失 数据 

生存 分 析 往 往 研究 在 不 同 的 时 间 点 或 时 期 被 研究 的 事件 发 生 的 概率 , 而 研究 的 周期 可 能 较 
长 , 需要 长 时 间 随 访 。 但 由 于 各 种 主观 或 客观 的 因素 ,随访 可 能 会 终止 ,导致 掌握 的 数据 仅 能 
提供 不 完整 的 信息 ， 这 些 数 据 就 是 删 失 数 据 。SPSS 中 通常 把 删 失 数据 的 示 性 函数 取 值 为 1。 


(3 ) 截 尾数 据 

截 尾数 据 和 删 失 数据 一 样 , 提供 的 也 是 不 完整 信息 , 但 与 删 失 数 据 稍 有 不 同 的 是 它 提 供 的 
是 与 时 间 有 关 的 条 件 信息 。SPSS 软件 只 考虑 对 完全 数据 和 删 失 数据 的 分 析 ， 对 截 尾数 据 不 提 
供 专门 的 分 析 方法 。 


3. 生存 分 析 的 方法 
按照 使 用 参数 与 否 ， 生 存 分 析 的 方法 可 以 分 为 以 下 3 种 。 


(1 ) 参数 方法 

在 长 期 的 实践 中 , 人 们 发 现 一 些 分 布 可 以 很 好 地 拟 合生 存 数据 的 经 验 形 状 , 使 假设 生存 数 
据 服从 某 个 已 知 分 布 ， 使 用 参数 分 布 方法 进行 生存 分 析 。 常 用 的 参数 模型 有 指数 分 布 模型 、 
Weibull 分 布 模型 、 对 数 正 态 分 布 模型 等 。 


(2 ) 非 参数 方法 
当 被 研究 事件 没有 很 好 的 参数 模型 可 以 拟 合 时 ， 通 常 可 以 采用 非 参 数 方法 进行 生存 分 析 。 
常用 的 非 参 数 模型 包括 生命 表 分 析 和 Kalpan-Meier 方法 。 


(3 ) 半 参 数 方法 
半 参 数 方法 是 目前 比较 流行 的 生存 分 析 方 法 ， 相 比 而 言 ， 半 参数 方法 比 参数 方法 灵活 ， 比 
非 参数 方法 更 易于 解释 分 析 结 果 。 常 用 的 半 参 数 模型 主要 为 Cox 模型 。 


16.2 ”寿命 表 分 析 


寿命 表 方法 是 一 种 重要 的 非 参数 估计 方法 , 它 不 仅 有 悠久 的 历史 , 而 且 广 泛 应 用 于 人 口 学 、 
医学 统计 、 保 险 和 可 靠 性 研究 等 诸多 领域 。 


16.2.1 ”寿命 表 分 析 简 介 


在 多 数 情况 下 , 我 们 都 会 希望 考察 两 个 事件 之 间 的 时 间 分 布 ， 比 如 雇用 时 长 (员工 从 雇用 
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到 离开 公司 的 时 间 )。 但是， 这 类 数据 通常 包含 没有 记录 其 第 二 次 事件 的 个 案 ( 例 如， 在 调查 
结束 后 仍然 为 公司 工作 的 员工 ) 。 这 种 情况 的 发 生 有 以 下 几 个 原因 : 对 于 某 些 个 案 , 事件 在 研 
究 结束 前 没有 发 生 ; 而 对 于 另 一 些 个 案 , 我 们 在 研究 结束 前 的 某 段 时 间 未 能 跟踪 其 状态 ; 还 有 
一 些 个 案 可 能 因 一 些 与 研究 无 关 的 原因 (如 员工 生病 或 请 假 ) 无 法 继续 。 这 些 个 案 总 称 为 已 审 
查 的 个 案 ， 它 们 使 得 此 类 研究 不 适合 t 检 验 或 线性 回归 等 传统 方法 。 

用 于 此 类 数据 的 统计 方法 为 跟 进 寿命 表 。 寿 命 表 的 基本 概念 是 将 观察 区 间 划 分 为 较 小 的 时 
间 区 间 。 对 于 每 个 区 间 ， 使 用 所 有 观察 至 少 该 时 长 的 人 员 计 算 该 区 间 内 发 生 事 件 终结 的 概率 。 
然后 使 用 从 每 个 区 间 估 计 的 概率 估计 在 不 同时 间 点 发 生 该 事件 的 整体 概率 。 


16.2.2 ”寿命 表 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 寿命 表 分 析 。 


1) 在 菜单 栏 中 依次 选择 “分 析 ”|“ 生 存 分 
析 ”|* 寿 命 表 ”命令 , 打开 如 图 16-1 所 示 的 “ 寿 
命 表 ”对 话 框 。 

2) 进行 相关 的 设置 。 

@ “时 间 ” 设 置 。 用 于 源 变 量 列 表 框 选择 
生存 时 间 变 量 ， 包 括 一 个 文本 框 和 “显示 时 间 
间隔 ”选项 组 。 


。 “时间” 列表 框 : 从 源 变量 列表 框 中 选择 [二 J] 匡 晤 革 浊 | 业 吉 
变量 , 单 击 “ 时 间 ” 列 表 框 前 的 国 按 钮 即 
可 将 已 选择 变量 先入 “时间” 列表 框 中 。 ee 

。 “显示 时 间 间 隔 ” 选 项 组 : 该 选项 组 用 于 设置 时 间 区 间 的 长 度 及 终点 。 寿命 表 分 析 以 时 间 
0 为 时 间 区 间 的 起 点 。“0 到 (HD)” 前 面 的 文本 框 用 于 输入 最 后 一 个 区 间 的 终点 值 ， 在 “ 按 
(Y)” 后 的 文本 框 中 输入 区 间 长 度 。 


@ “状态 ”列表 框 。 从 源 变量 列表 框 中 选择 变量 ， 单 击 “状态 ”列表 框 前 的 国 按 钮 即 可 
将 已 选择 的 变量 选 入 “状态 ”列表 框 中 ， 此 时 将 激活 “定义 事件 ”按钮 ， 单 击 该 按钮 ， 弹 出 如 
图 16-2 所 示 的 “寿命 表 : 为 状态 变量 定义 事件 ”对 话 框 。 

“寿命 表 : 为 状态 变量 定义 事件 ”对 话 框 中 包含 “ 单 值 ” 与 “ 值 的 范围 ”两 个 单 选 按 钮 : 


。 单 值 : 选中 该 单 选 按钮 后 ， 可 以 在 其 后 的 文本 框 中 输入 一 个 指示 事件 发 生 的 数值 。 输 入 这 
个 值 后 ， 带 有 其 他 值 的 观测 都 被 视 作 截断 观测 。 
。 值 的 范围 : 选中 该 单 选 按钮 后 ， 可 以 在 其 后 的 文本 框 中 输入 指示 事件 发 生 的 数值 区 间 ， 两 
个 文本 框 分 别 输入 数值 区 间 的 上 下 限 ， 观 测 值 不 在 这 个 区 间 内 的 观测 都 被 视 作 截断 观测 。 
设置 完毕 后 ， 单 击 “ 继 续 ” 按 钮 回 到 “寿命 表 ” 对 话 框 进行 其 他 设置 。 
@@ “因子 ”列表 框 。 用 于 从 左 侧 源 变量 列表 框 中 选 入 一 阶 因素 变量 ， 选 入 变量 后 ，“ 定 
义 范围 ”按钮 被 激活 ， 单 击 该 按钮 ， 弹 出 如 图 16-3 所 示 的 “寿命 表 : 定义 因子 范围 ”对 话 框 。 
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蛤 寺 命 雪 : 为 状态 变量 定义 事件 x 


这 些 值 指示 事件 已 发 生 
回 单 值 S): | 
口 他 WE 国 W: 


9) ea Eua 
图 16-2 “寿命 表 : 为 状态 变量 定义 事件 ”对 话 框 。 ”图 163 
该 对 话 框 包括 两 个 文本 框 : 


。 最 小 值 : 用 于 设置 因素 变量 的 下 限 。 
。 最 大 值 : 用 于 设置 因素 变量 的 上 限 。 


@ “ 按 因 子 ”列表 框 。 该 列表 框 用 于 从 源 变量 列表 | | 部 外 日 和 2 


框 中 选 入 二 阶 因素 变量 ， 选 入 变量 后 ，“ 定 义 范围 ”按钮 | | 日 一 再 站 分 本数 芭 


被 激活 ， 单 击 该 按钮 ， 弹 出 与 如 图 16-3 相同 的 对 话 框 ,该 | [tH 第 -个 因 了 83 和 8 
对 话 框 所 包含 内 容 与 设置 方法 均 与 “因子 ”列表 框 中 相关 | | 旦 天 由 


名 总 体 O) 
设置 相同 ， 在 此 不 再 资 述 。 © MdE) 
@ “选项 ”按钮 。 在 “寿命 表 ” 对 话 框 中 单 击 “ 选 
项 ”按钮 , 打开 如 图 16-4 所 示 的 “寿命 表 : 选项 ”对 话 框 。 (eee) Cun Cum) 


。 “寿命 表 ” 复 选 框 : 用 于 选择 是 否 输出 寿命 表 。 图 16-4 “寿命 表 选项 ”对 话 杠 
。 “图 ”选项 组 : 用 于 选择 所 输出 的 函数 图 形 。 
> 选中 “生存 分 析 ” 复 选 框 ， 将 输出 累计 生存 函数 
> 选中 “风险 ” 复 选 框 ， 则 将 输出 累计 和 危险 函数 ; 
> 选中 “一 减 生存 分 析 函 数 ” 复 选 框 ， 则 将 输出 1- 累 计生 存 函 数 ; 
> 选中 “生存 分 析 对 数 ” 复 选 框 ， 则 将 输出 以 对 数 形式 刻度 显示 的 累计 生存 函数 
> 选中 “密度 ” 复 选 框 ， 则 会 输出 密度 函数 
。 “比较 第 一 个 因子 的 级 别 ”选项 组 : 用 于 选择 比较 不 同 水 平 的 一 阶 因素 变量 的 方法 。 若 选 
中 “无 ” 单 选 按钮 ， 则 不 进行 子 群 之 间 的 比较 ; 若 选中 “总 体 ” 单 选 按钮 ， 则 比较 所 有 水 
平 的 一 阶 因素 变量 ; 若 选中 “成 对 ” 单 选 按钮 ， 则 配对 比较 一 阶 因素 变量 水 平 。 
3) 输出 结果 。 
所 有 设置 结束 后 ， 单 击 “ 寿 命 表 ”对 话 框 中 的 “确定 ”按钮 ， 即 可 输出 生存 分 析 结果 。 


16.2.3 ”实验 操作 


下 面 将 以 “16-1” 数 据 文件 为 例 , 讲解 寿命 表 分 析 的 具体 操作 过 程 并 对 输出 结果 进行 说 明 。 
1. 实验 数据 描述 


“16-1” 数 据 文 件 记录 了 某 保险 公司 各 部 门 员工 的 在 职 情况 ， 统 计 的 部 门 有 承保 部 、 理 赔 
部 、 人 事 部 和 理财 部 4 个 部 门 , 接 下 来 本 书 将 利用 生命 表 过 程 得 出 各 个 部 门 员工 的 “生存 ”( 在 
职 ) 情况 。“16-1” 数 据 文件 的 原始 Excel 表 如 图 16-5 所 示 。 

在 SPSS 变量 视图 中 建立 “工作 时 间 ”“ 部 门 ” 和 “是 否 在 职 ”3 个 变量 ，“ 工 作 时 间 ” 
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的 度量 标准 是 “度量 ”“ 部 门 ” 和 “是 否 在 职 ”的 度量 标准 是 “名 义 ”“16-1” 数 据 文件 的 变 
量 视图 如 图 16-6 所 示 。 


a A did te 


图 16-5 “16-1” 数 据 文件 原始 数据 


在 SPSS 数据 视图 中 输入 相应 数据 ， 其 中 “部 门 ” 变 量 中 用 数字 1~4 分 别 表示 承保 部 、 理 
赔 部 、 人 事 部 和 理财 部 ，“ 是 否 在 职 ” 变 量 中 用 1 表示 在 职 ，0 表示 不 在 职 ， 如 图 16-7 所 示 。 


| 国 4 六 ay 可- BM 5p55 Statstics 条 WHB 生 = 办 二 ssev | 牙 理 扫 1] -BM 5P55 Statktics 数 风 全 = 
.文件 吉 糙 全 】 重 看 WD 娄 据 中 转 执 DD 分析 (4) 站 史册 图 WG) 实用 粮 麻 (UD) 扩展 0 窗口 OY) 玫 助 H) 


| 机: 391 要 时 
ZW ARER | Ra | Ra | 克 量 
3 


到 上 到 疼 上 到 量 | 角色 | 
11 性 右 未 知 入 入 入 


11 通 右 未 如 所 输入 
人 1。 沐 右 未 和 愉 输 入 


BM SPSS Statishics 处 更 程序 纺 闭 | JUnicodeON| | | JBM SPSS Stalstics 半 理 程序 雪线 Unicode ON|_ 
16-6 “16-1” 数 据 文件 的 变量 视图 图 16-7 “16-1” 数 据 文 件 的 数据 视图 
2. 实验 操作 步骤 


GE56i 打开 “16-1” 数 据 文 件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 生 存 分 析 ”| “寿命 表 ” 命 令 ， 打开 “寿命 表 ” 对 话 框 。 

V0 从 源 变 量 列表 框 中 选择 “工作 时 间 ” 变 量 ,“ 时 间 ” 列 表 框 中 ， 然 后 设置 时 间 区 间 
的 “0 到 (HD)” 值 为 60,“ 按 (Y)” 为 3。 


379 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


人 GES363 从 源 变 量 列表 框 中 选择 “是 否 在 职 ” 变 量 ， 选 入 “状态 ”列表 框 中 ， 然 后 单 击 “ 定 
义 事件 ”按钮 ， 弹 出 “寿命 表 : 为 状态 变量 定义 事件 ”对 话 框 。 由 于 “16-1” 数 据 文 
件 中 用 1 表示 事件 发 生 , 所 以 选中 “ 单 值 ” 单 选 按钮 , 并 在 其 后 面 的 文本 框 中 输入 1， 
将 取 值 为 0 的 观测 作为 截断 观测 ， 单 击 “ 继 续 ” 按 钮 。 

人 GE364 从 源 变 量 列表 框 中 选择 “部 门 ” 变 量 ， 选 入 “因子 ”列表 框 中 ， 然 后 单 击 “定义 范 

围 ”按钮 ， 弹 出 “寿命 表 : 定义 因子 范围 ”对 话 框 ， 在 “最 小 值 ”文本 框 中 输入 1， 
在 “最 大 值 ”文本 框 中 输入 4， 单 击 “ 继 续 ” 按 钮 。 

GE365 单 击 “ 选 项 ”按钮 ， 弹 出 “寿命 表 : 选项 ”对 话 框 ， 选 中 “寿命 表 ” 和 “生存 分 析 ” 
复 选 框 ,“ 比 较 第 一 个 因子 的 级 别 ” 选 项 组 采用 默认 设置 。 

3. 实验 结果 及 分 析 


设置 完毕 后 , 单 击 “ 确 定 ” 按 钮 ,， SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 16-8~ 图 16-10 
所 示 。 

图 16-8 给 出 了 员工 在 职 年 限 寿命 表 输出 结果 部 分 截 选 图 ) 。 该 寿命 表 给 出 了 4 个 部 门 
对 应 时 间 内 的 在 职 和 不 在 职员 工 数 ， 并 计算 出 员工 在 职 比率 等 统计 量 。 


而 合家 
7 
+ 风 间 内 儿 国 来 果 让 人 莉 村 
地 4 网 ER 的 要 上 放生 晤 

CD 3 了 204500 0 加 加 加 加 3 004 加 mo 
3 3 1 7 7 加 0 加 005 6 o 

日 225 12 220000 加 05 5 6 02 014 004 0 吧 

9 204 加 198 500 1 器 加 加 加 014 004 加 ol 

位 193 1 176500 6 0 97 了 03 009 004 0 00 

加 164 0 159000 5 器 加 76 中 008 004 of 00 

人 149 15 141 500 1 加 的 75 03 002 0 oo 0 

a 133 下 130000 4 四 7 3 o3 008 004 器 加 

2 13 四 118000 4 0 97 加 008 004 站 0 

了 109 4 107000 2 0 四 加 0 004 003 站 00 

0 103 D 8500 4 ou 加 可 o3 009 005 加 中 

加 器 7 1 500 3 om 四 加 中 008 005 of 加 

6 7 7 6500 2 加 加 2 0 006 004 of of 

四 加 5 Sa500 3 05 四 9 0 En 005 6 ol 

要 器 S0000 1 ft: 四 加 中 004 004 of of 

由 四 7 42500 1 0 加 加 加 005 004 of 0 

四 加 7 34500 a m m 6 0 oo00 oo0 00 on 

5 加 5 28500 9 器 100 加 0 000 000 0 o0 

加 6 a 22000 a mo 100 加 0 000 000 加 00 

7 18 日 15000 a 0 100 加 0 000 000 oo 00 

0 12 四 000 0 00 0 6 加 000 000 00 00 

2 0 281 3 278500 1 门 100 100 0 00 001 0 00 
3 a7 5 274500 a 加 加 2 0 mo 003 of o0 

日 264 260000 3 站 中 % of 004 00: 中 站 

253 252000 3 中 加 加 中 oo4 oo; oo oo 


图 16-8 寿命 表 输出 结果 


图 16-9 给 出 了 4 个 部 门 员工 的 生存 时 间 中 位 数 ， 即 生存 率 等 于 。 生存 分 析 时 间 中 位 数 
50% 时 ， 生 存 时 间 的 平均 水 平 。 很 明显 ， 由 图 可 知 ， 该 保险 公司 4 个 joy wiv 


部 门 的 员工 有 50% 的 员工 在 职 时 间 超 过 60 个 月 。 Nm 1 60.00 
图 16-10 给 出 了 4 个 部 门 员工 是 否 在 职 累计 生存 函数 图 , 它 是 对 ET 
生命 表 的 图 形 展示 。 由 图 可 以 清楚 地 看 到 ， 承 保 部 和 理财 部 两 个 部 : 


门 员 工 累计 生存 率 下 降 最 快 ， 理 赔 部 员工 累计 生存 率 下 降 速 度 低 于 
人 事 部 员工 。 图 16-9 生存 时 间 中 位 数 
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生存 分 析 函 数 
10| 一 部 站 
La } 
EE 了 
o 时 
一 一 
累 0 时 了 让 
积 
生 一 
和 | 3 
析 oz 
i 
o 时 = 
人 
Es 
T T T T T T T 
0 0 加 3 站 田 


工作 时 间 


图 16-10 累计 生存 函数 图 输出 结果 
16.3 Kaplan-Meier 分 析 


Kaplan-Meier 分 析 方 法 又 称 乘法 极限 估计 、PL 法 或 最 大 似 然 估计 法 , 是 由 Kaplan 和 Meier 
在 1958 年 提出 的 一 种 求生 存 函数 的 非 参数 方法 。 寿 命 表 分 析 适 用 于 大 样本 情况 ， 在 处 理 小 样 
本 时 ， 为 充分 利用 每 个 数据 所 包含 的 信息 ，Kaplan-Meier 分 析 便 成 为 首选 的 分 析 工 具 。 


16.3.2 ”Kaplan-Meier 分 析 的 SPSS 操作 


在 SPSS Statistics 数据 编辑 器 窗口 中 进行 
Kaplan-Meier 分 析 的 操作 步骤 如 下 。 

1) 在 菜单 栏 中 依次 选择 “分 析 ”|“ 生 存 分 析 ” 
| Kaplan-Meier 命令 ， 打 开 Kaplan-Meier 对 话 框 ， 
如 图 16-11 所 示 。 

2) 进行 相关 的 设置 。 

@ “时 间 ” 列 表 框 。 用 于 从 源 变量 列表 框 选 
入 一 个 时 间 变 量 ， 该 时 间 变 量 可 以 以 任何 长 度 为 
单位 ， 在 时 间 变 量 中 如 果 存 在 负数 ， 则 分 析 过 程 
不 考虑 此 负数 。 图 16-11 Kaplan-Meier 对 话 框 

@ “状态 ”列表 框 。 该 列表 框 用 于 选 入 一 个 状态 变量 ， 选 入 后 将 激活 “定义 事件 ”按钮 ， 
单 击 该 按钮 ， 打 开 如 图 16-12 所 示 的 “Kaplan-Meier: 为 状态 变量 定义 事件 ”对 话 框 。 

“Kaplan-Meier: 为 状态 变量 定义 事件 ”对 话 框 中 包含 “ 单 值 ”“ 值 的 范围 ”与 “ 值 的 列 
表 ”3 个 单 选 按钮 。 
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@ 
@ 


单 值 : 选中 该 单 选 按 钮 ， 可 以 在 其 后 的 文本 框 中 输入 一 个 指示 事件 发 生 的 数值 。 在 输入 这 
个 值 后 ， 带 有 其 他 值 的 观测 都 被 视 作 截断 观测 。 

值 的 范围 : 只 有 在 状态 变量 为 数值 时 ，“ 值 的 范围 ”选项 才 可 用 。 选 中 该 单 选 按钮 ， 在 其 
后 的 文本 框 中 输入 指示 事件 发 生 的 数值 区 间 ， 两 个 文本 框 分 别 输入 数值 区 间 的 上 下 限 ， 观 
测 值 不 在 这 个 区 间 内 的 观测 都 被 视 作 截断 观测 。 

值 的 列表 : 选中 该 单 选 按钮 ， 可 设置 指示 事件 发 生 值 的 列表 框 。 在 其 后 文本 框 中 输入 数值 
后 ， 单 击 “ 添 加 ”按钮 将 其 加 入 列表 框 中 ， 如 此 重复 可 以 指定 代表 事件 发 生 的 多 个 不 同 的 
值 ; 如 果 需 要 更 改 已 选 入 的 值 ， 先 在 列表 框 中 选择 ,然后 在 “ 值 的 列表 ”文本 框 进行 编辑 ， 
最 后 单 击 “ 更 改 ” 按 钮 确认 ， 或 者 单 击 “删除 ”按钮 进行 删除 。 

“因子 ”列表 框 。 该 列表 框 用 于 从 源 变 量 列表 框 中 选 入 分 类 变量 。 

“比较 因子 ”按钮 。 用 户 选 入 “因子 ”变量 将 激活 “比较 因子 ”按钮 ， 单 击 该 按钮 ， 


将 弹出 如 图 16-13 所 示 的 “Kaplan-Meier: 比较 因子 级 别 ” 对 话 框 。 该 对 话 框 可 用 于 设置 比较 
分 类 变量 的 统计 量 以 检验 因子 不 同 级 别 的 生存 分 布 的 等 同性 。 


蛤 Kkaplan-Meier， 为 状态 变量 定义 事件 ”X 


起 kaplan-Meier: 比较 因子 级 别 


检验 统计 
] 陵 9 邱 d] 四 布 备 斯 洛 () 思域 罗 内 书 尔 QN) 


(| [ET 
图 16-12 “Kaplan-Meier: 为 状态 变量 定义 事件 ” 图 16-13 “Kaplan-Meier: 比较 因子 级 别 ” 
“检验 统计 ”选项 组 用 于 选择 检验 统计 的 方法 ， 具 体内 容 如 表 16-1 所 示 。 


表 16-1 “检验 统计 量 ” 方 法 


统计 量 含义 
秩 的 等 级 该 方法 用 于 比较 生存 分 布 的 等 同性 的 检验 ， 在 此 检验 中 ， 所 有 时 间 点 均 赋 予 相同 的 权重 


布雷 斯 洛 该 方法 用 于 比较 生存 分 布 的 等 同性 的 检验 ， 在 每 个 时 间 点 用 带 风险 的 个 案 数 对 时 间 点 加 权 


塔 罗 内 - 韦 尔 
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该 方法 用 于 比较 生存 分 布 的 等 同性 的 检验 ， 在 每 个 时 间 点 用 历险 的 个 案 数 的 平方 根 对 时 间 
点 加 权 


选择 检验 统计 方法 后 ， 下 方 的 用 于 选择 比较 方法 的 项 将 被 激活 。 

若 选中 “因子 级 别 的 线性 趋势 ” 复 选 框 ， 则 会 使 用 倾向 信息 来 检验 生存 分 布 是 否 相等 ， 只 
有 当 分 组 因素 是 有 序 变量 时 ， 做 线性 趋势 检验 才 有 实际 意义 ， 这 种 情况 下 ，SPSS 假定 各 级 别 
之 间 的 效应 是 等 距 的 。 

最 后 一 组 单 选 按钮 用 来 指定 进行 总 体 比较 还 是 两 两 比较 ,以 及 对 分 层 变量 的 处 理 方式 , 可 
选项 有 4 个 ， 各 选项 含义 参见 表 16-2。 
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表 16-2 比较 因子 级 别 方法 


方法 含义 
在 层 之 间 汇 聚 用 于 在 单 次 检验 中 比较 所 有 因子 级 别 ， 以 检验 生存 曲线 的 相等 性 
在 层 之 间 成 对 比较 用 于 比较 每 一 个 相 异 的 因子 级 别 对 ， 不 提供 成 对 趋势 检验 
针对 每 个 层 用 于 对 每 层 的 所 有 因子 级 别 的 相等 性 执行 一 次 单独 的 检验 。 如 果 没 有 分 层 变 
量 ， 则 不 执行 检验 


比较 每 一 层 的 每 一 因 时 ， 不 提供 成 对 。 如 果 ; 
守则 答 相 反 成 对 说 用 于 比较 每 一 层 的 每 一 个 相 异 的 因子 级 别 对 ， 不 提供 成 对 趋势 检验 。 如 果 没 


有 分 层 变 量 ， 则 不 执行 检验 


@ “ 层 ” 列 表 框 。 该 列表 框 用 于 选 入 分 层 变 量 ， 可 以 看 作 是 研究 者 欲 加 以 控制 的 混杂 因 
素 ，SPSS 会 对 其 中 每 个 取 值 级 别 分 别 进行 分 析 。 

@ “个 案 标注 依据 ”列表 框 。 该 列表 框 用 于 选 入 观测 的 标签 变量 ，SPSS 将 以 变量 标签 值 
列 出 所 有 的 变量 。 

@ “保存 ”按钮 。 单 击 该 按钮 ， 将 弹出 如 图 16-14 所 示 的 “Kaplan-Meier: 保存 新 变量 ” 


通过 对 该 对 话 框 的 设置 可 以 将 Kaplan-Meier 表 的 信息 保存 为 新 变量 ， 新 变量 可 在 以 后 的 
分 析 中 用 于 检验 假设 或 检查 假设 。 对 话 框 包括 4 个 复 选 框 ， 分 别 为 : 

e 生存 分 析 : 保存 累积 生存 概率 估计 ， 默 认 变 量 名 为 前 级 sur_ 加 上 顺序 号 。 例如， 如 果 已 
存在 sur_1，Kaplan-Meier 就 分 配 变量 名 sur_2。 

。 生存 分 析 标准 误差 : 保存 累积 生存 估计 的 标准 误差 , 默认 变量 名 为 前 级 se_ 加 上 顺序 号 。 
例如 ， 如 果 已 存在 se 1，Kaplan-Meier 就 分 配 变量 名 se_2。 

。 风险 : 保存 累积 风险 函数 估计 ， 默 认 变量 名 为 前 绥 haz 加 上 顺序 号 。 例 如 ， 如 果 已 存在 
haz_ 1，Kaplan-Meier 就 分 配 变量 名 haz 2。 

。 累积 事件 : 保存 当 个 案 按 其 生存 时 间 和 状态 代码 进行 排序 时 的 事件 累积 频率 ， 默 认 变量 
名 为 前 级 cum_ 加 上 顺序 号 。 例 如， 如 果 已 存在 cum_1，Kaplan-Meier 就 分 配 变量 名 cum_2。 


图 “选项 ”按钮 。 单 击 该 按钮 , 将 弹出 如 图 16-15 | 蛤 kaplan-Meier: 选项 
所 示 的 “Kaplan-Meier: 选项 ”对 话 框 。 


[| Kaplan-Meier: 保存 .. XX 


回 风险 tH) 
回 累积 事件 (C) 
16-14 “Kaplan-Meier: 保存 新 变量 ”对 话 框 图 16-15 “Kaplan-Meier: 选项 ”对 话 框 


“统计 ”选项 组 用 于 设置 分 析 过 程 中 需要 计算 的 统计 量 ， 详 细 介 绍 如 表 16-3 所 示 。 
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表 16-3 “统计 ”选项 组 内 容 


统计 量 含义 
选中 该 复 选 框 ， 则 会 输出 简化 的 生存 表 ， 类 似 于 生命 表 ， 只 是 以 个 体 为 
生存 分 析 表 单位 输出 
选中 该 复 选 框 ， 则 会 输出 该 生存 时 间 的 均值 和 中 位 数 ， 以 及 生存 时 间 的 
平均 值 和 中 位 数 生存 分 析 函 数 标准 差 和 置信 区 间 


四 分 位 数 选中 该 复 选 框 ， 则 会 输出 生存 时 间 的 三 个 四 分 位 数 


“图 ”选项 组 用 于 设置 分 析 过 程 中 需要 输出 的 图 形 ， 详 细 介绍 如 表 16-4 所 示 。 
表 16-4 “图 ”选项 组 内 容 


图 含义 
生存 分 析 函 数 选中 该 复 选 框 ， 则 会 输出 在 线性 刻度 上 显示 的 累积 生存 函数 曲线 
一 减 生存 分 析 函 数 选中 该 复 选 框 ， 则 会 输出 以 线性 刻度 绘制 的 一 减 生存 函数 曲线 
风险 选中 该 复 选 框 ， 则 会 输出 在 线性 刻度 上 显示 的 累积 风险 函数 
生存 分 析 函 数 的 对 数 选中 该 复 选 框 ， 则 会 输出 在 对 数 刻度 上 显示 的 累积 生存 函数 曲线 
3) 输出 结果 。 


所 有 设置 结束 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 输出 Kaplan-Meier 分 析 结 果 。 


16.3.3 ”实验 操作 


下 面 将 以 “16-2” 数 据 文件 为 例 ,讲解 Kaplan-Meier 分 析 方法 的 具体 操作 过 程 并 对 输出 结 
果 进 行 说 明 。 
1. 实验 数据 描述 


“16-2” 数 据 文件 包含 用 于 治疗 慢性 关节 炎 疼 痛 的 抗 炎 药 的 临床 实验 结果 , 我 们 感 兴趣 的 
是 该 药 见效 的 时 间 以 及 它 和 现 有 药物 的 比较 。 该 数据 文件 包括 患者 的 年 龄 、 性 别 、 健 康 状况 、 
是 否 用 新 药 治疗 、 治 疗 后 的 效果 及 用 药 后 的 生效 时 间 等 相关 数据 ， 我 们 将 利用 Kaplan-Meier 
分 析 方 法 ， 得 到 两 种 药品 药 效 的 生存 表 并 验证 两 种 药品 效果 间 的 差异 是 否 显著 。“16-2” 数 据 
文件 的 原始 Excel 表 如 图 16-16 所 示 。 

首先 在 SPSS 变量 视图 中 建立 “年 龄 ”“ 性 别 ”“ 健 康 状 况 ”“ 治 疗 ”“ 剂 量 ”“ 治 疗 状 
况 ”“ 生 效 时 间 ”6 个 变量 ， 各 变量 的 详细 设置 结果 如 图 16-17 所 示 。 

在 SPSS 数据 视图 中 输入 相关 变量 的 数据 ， 其 中 “性 别 ” 变 量 中 用 0 代表 “ 男 ”，1 代表 
“ 女 ”; “健康 状况 ”中 用 1 表示 “ 差 ”，2 表示 “一 般 ”，3 表示 “好 ”; “治疗 ”变量 中 
用 0 和 1 分 别 代 表 “ 新 药 ” 和 “ 现 有 药 ”; “剂量 ”变量 中 用 0 和 1 分 别 代 表 “ 低 ”和 “高 ” 
剂量 ; “治疗 状况 ”中 用 0 表示 “ 截 尾 ”，1 表示 “生效 ”， 数 据 输入 完毕 后 如 图 16-18 所 示 。 


2. 实验 操作 步骤 


GE56i) 打开 “16-2” 数 据 文 件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 生 存 分 析 ”|“Kaplan-Meier” 命 令 ， 打 开 Kaplan-Meier 对 话 框 。 
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下 G 
莉 疗 状况 ， 生 效 时 间 《小 时 ) 
生效 


a 


下 宗 宗 宗 闻 训 到 蒜 京 计 囊 六 康 训 妹 节 京 训 到 于 于 到 到 到 漳 
和 让 人 十 江 让 让 训 全 济 全 诺 克 诺 禹 导 谨 


LE 和 PTEYTET TTY EE 
高 名义 只 全 入 0 0 

EE LL 

交往 入 

二 四 入 

病名 XX 六 入 

FH NG 


[ jEM spS3 3talistics 处 于 程序 妨 风 UnicodeON | 虽 M SPSS Statistics 处 于 程序 该 线 UnicodeON | 
图 16-17 “16-2” 数 据 文件 的 变量 视图 图 16-18 “16-2” 数 据 文件 的 数据 视图 


E70 从 源 变量 列表 框 中 选择 “生效 时 间 ” 变 量 ， 先 入“ 时间” 列表 框 中 。 

(GE563 从 源 变 量 列表 框 中 选择 “治疗 状况 ”变量 ， 选 入 “状态 ”列表 框 中 ， 然 后 单 击 “ 定 
义 事件 ”按钮 ， 弹 出 “Kaplan-Meier: 状态 变量 定义 事件 ”对 话 框 。 由 于 “16-2” 数 
据 文件 中 用 1 表示 事件 发 生 ， 所 以 选中 “ 单 值 ” 单 选 按钮 后 ， 在 其 后 面 的 文本 框 中 
输入 1， 将 取 值 为 0 的 观测 作为 截断 观测 。 设 置 完 毕 后 ， 单 击 “ 继 续 ” 按 钮 。 

653 将 “治疗 ”变量 选 入 “因子 ”列表 框 。 

ES65 单 击 “ 比 较 因子 ”按钮 ， 弹 出 “Kaplan-Meier: 比较 因子 级 别 ” 对 话 框 ， 选 中 “ 检 
验 统计 ”选项 组 中 的 “ 秩 的 对 数 ”“ 布 雷 斯 洛 ” 和 “ 塔 罗 内 - 韦 尔 ” 复 选 框 ， 其 他 保持 
默认 设置 ， 单 击 “ 继 续 ” 按 钮 。 
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GE565 单 击 “ 选 项 ”按钮 ， 弹 出 “Kaplan-Meier: 选项 ”对 话 框 ， 选 择 “ 统 计 ” 选 项 组 中 的 
“生存 分 析 表 ”“ 和 平均 值 和 中 位 数 生存 分 析 函 数 ” 和 “四 分 位 数 ” 复 选 框 及 “图 ” 选 
项 组 中 的 “生存 分 析 函 数 ” 复 选 框 。 


3. 实验 结果 及 分 析 
所 有 设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 16-19~ 


图 16-24 所 示 。 个 案 处 理 摘要 
如 图 16-19 所 示 的 “个 案 处 理 摘 要 ”给 出 了 样本 数 | Co, 
据 的 简要 信息 ， 包 括 新 药 、 现 有 药 及 样本 整体 的 总 数 、 一 一 一 一 


事件 发 生 数 等 。 项 有 机 96 74 22 229% 
图 16-20 给 出 了 类 似 于 寿命 表 分 析 中 年 限 表 的 生 。” 半 到 人生 


存 表 ， 只 是 生存 表 中 每 个 观测 单独 占据 一 行 。 图 16-19 止痛 药 分 析 个 案 处 理 捕 要 
生存 分 析 表 
前 款 计 生存 分 析 比 例 
治疗 对 间 伙 志 滞 和 | 标准 误 关 。 累积 事件 数 其余 个 案 数 
新 本 出 .500 有效 1 103 
2 | .600 ”有效 .981 013 2 102 
3 700 ”有效 971 016 3 101 
4 800 有 并 962 019 4 100 
5 = .900 有效 .952 021 5 99 
站 1.100 有 站 6 98 
家 1.100 有效 .933 .025 4 97 
8 1200 有效 8 96 
9 1.200 ”有效 .913 .029 9 95 
10 1.300 有效 10 94 
dt 1.300 ”有 找 11 93 
12 1.300 有效 985 031 12 92 
13 1.400 ”有 以 875 032 13 91 
14 1.500 有效 14 90 
15 1.500 ”有效 15 89 
16 1.500 ”有效 .846 .035 16 88 
17 1.600 ”有效 tA 87 
18 1.600 有效 .827 .037 18 86 
19 1.700 有效 19 85 
20 1.700 有效 20 84 
2 1700 有效 798 039 24 83 


图 16-20 止痛 药 分 析 生命 表 
图 16-21 和 图 16-22 分 别 给 出 了 生命 表 的 平均 值 和 中 位 数 及 其 百 分 位 数 ， 由 两 图 可 以 明显 
地 看 出 , 新 药 和 旧 药 在 平均 值 、 中 位 数 及 四 分 位 数 上 的 差异 都 不 是 很 明显 , 由 此 可 以 初步 判断 ， 
新 药 和 旧 药 在 生效 时 间 上 的 差异 不 太 明 显 。 


生存 分 析 时 间 的 平均 值 和 中 位 数 
均值 位 数 
95% 置信 区 同 95% 置信 区 同 
Ei 舍 咎 标准 误差 下 限 上 由 5 算 标准 识 莽 F 限 上 厌 
新 药 4867 360 4162 5572 ， 3700 292 3128 4272 
mn 5195 350 4499 5671 4100 1131 1.884 6316 
LE 5014 252 ， 4520 5507 ， 3900 272 3367 4433 


a, 如 果 已 对 生存 分 析 时 间 进 行 检 刷 ， 那 么 估算 将 限于 最 大 生存 分 析 对 间 。 


16-21 止痛 药 分 析 生 命 表 的 均值 和 中 位 数 
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图 16-23 给 出 了 整体 比较 的 结果 ， 由 3 种 检验 的 显著 性 可 以 看 出 ， 在 0.05 的 显著 性 水 平 
上 ， 新 药 和 旧 药 在 生效 时 间 上 差异 是 不 显著 的 。 


站 总 体 比 较 
卡 广 自由 度 显著 性 
5.0% 50.0% 75.0% 
治 和 估算 。 | 标准 误差 。 估算 。 | 标准 名次 估算。 | 标准 误差 ee 3 ! 
Breslow (Generalized 748 1 387 
新 药 7.100 509 3.700 292 1.900 226 Wilcoxon) 
现 有 二 | 7.700 648 4100 1.131 2.400 247 sen 705 1 401 
总 体 7.300 371 3900 272 2100 196 针对 治疗 的 不 同 组 出 进行 的 生存 分 析 分 布 等 同性 术 验 。 
16-22 ”止痛 药 分 析 百 分 位 数 图 16-23 止痛 药 分 析 整 体 比较 


图 16-24 形象 地 描述 了 生命 表 的 内 容 ， 从 生存 分 析 函 数 图 中 我 们 可 以 直观 地 看 出 ， 旧 药 的 
生效 时 间 比 新 药 稍 慢 一 些 ， 但 从 假设 检验 的 结果 看 ， 这 一 差异 并 不 明显 。 


生存 分 析 函 数 
‘od 油 疗 
-新 
mR 有 
二 -新 及- 析 抽 上 
站 更 有 药 - 从 出 后 
o 时 
A 
累 oe 
分 
扩 04] 
02 
o 叶 
T T T T T T T 
5 2 4 § 3 0 位 
生效 时 间 


图 16-24 止痛 药 生存 分 析 函 数 图 


16.4 Cox 回归 分 析 


Cox 回归 是 一 种 半 参 数 模型 ， 与 参数 模型 相 比 ， 该 模型 不 能 给 出 各 时 点 的 风险 率 ， 但 对 
生存 时 间 分 布 无 要 求 ， 可 估算 出 各 研究 因素 对 风险 率 的 影响 ， 因 而 应 用 范围 更 广 。 


16.4.1 Cox 回归 分 析 的 基本 原理 
Cox 回归 是 生存 分 析 中 重要 的 方法 之 一 ， 其 优点 是 适用 范围 很 广 以 及 便于 做 多 因素 分 析 。 
Cox 回归 假定 病人 的 风险 函数 如 公式 〈16-3) 所 示 : 
h(t) =h (Dexp(b KX +b,X, +--+b,X,) (16-3) 
其 中 MD 为 风险 函数 ， 又 称 风 险 率 或 瞬间 死亡 率 ，jo(D) 为 基准 风险 函数 ， 是 与 时 间 有 关 的 


任意 函数 ， 拉 ,2 分 别 是 观察 变量 及 其 回归 系数 。 英国 统计 学 家 D. R. Cox 提出 了 参数 bi; 的 估计 
和 检验 方法 ， 故 称 为 Cox 回归 。 
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利用 风险 函数 和 生存 函数 的 关系 式 ， 如 公式 16-4) 所 示 : 
sO=espLjnod (16-4) 

可 以 推导 出 生存 函数 的 公式 如 式 〈16-5) 所 示 : 
SCD = a fh (Dexp(bX +b,X, +---+b,T,)dt] (16-5) 


通过 此 公式 ， 我 们 可 以 得 到 相应 的 生存 函数 图 。 


16.4.2 ”Cox 回归 分 析 的 SPSS 操作 


在 SPSS Statistics 数据 编辑 器 窗口 中 进行 Cox 回归 分 析 的 步骤 如 下 。 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 生 存 分 析 ”|“Cox 回归 ”命令 ， 弹 出 如 图 16-25 所 示 的 
“Cox 回归 ”对 话 框 。 

2) 进行 相关 的 设置 。 

@ “时 间 ” 列 表 框 。 选 入 一 个 时 间 变量 ， 可 以 以 任何 长 度 为 单位 ， 在 时 间 变 量 中 如 果 存 
在 负数 ， 则 分 析 过 程 不 考虑 此 负数 。 

@ “状态 ”列表 框 。 选 入 一 个 状态 变量 ， 此 时 将 激活 “定义 事件 ”按钮 ， 单 击 该 按钮 ， 
弹出 如 图 16-26 所 示 的 “Cox 回归 : 为 状态 变量 定义 事件 ”对 话 框 。 


内 cox 回 昌 : 为 状态 变量 定义 事件 


这 些 值 指示 事件 已 发 生 
| 
〇 值 的 范围 W): 到 
加 值 的 列表 (L): 


De EE 


图 16-25 “Cox 回归 ”对 话 框 图 16-26 “Cox 回归 : 为 状态 变量 定义 事件 ”对 话 框 
该 对 话 框 同样 包含 3 个 单 选 按钮 :“ 单 值 ”“ 值 的 范围 ”与 “ 值 的 列表 ”, 其 含义 同 Kaplan- 
Meier 分 析 。 
@ “ 协 变量 ”选项 组 。 该 选项 组 主要 包括 “ 协 变量 ”列表 框 和 “方法 ”下 拉 列 表 框 。 
“ 协 变量 ”列表 框 用 于 从 左 侧 源 变量 列表 选 入 协 变量 , 用 户 可 以 一 次 选 入 多 个 协 变量 ， 当 
从 左 侧 源 变 量 列表 框 中 同时 选择 两 个 以 上 变量 时 ， 单 击 苞 国 按钮 可 以 选 入 这 些 变量 的 交互 项 
作为 协 变量 ; “方法 ”下 拉 列 表 框 用 于 设置 协 变量 进入 回归 方程 的 方式 ， 包 括 7 个 选项 ， 如 表 
16-5 所 示 。 
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表 16-5 “方法 ”下 拉 列 表 框 内 容 


方法 含义 
输入 选择 此 项 ， 则 只 检查 变量 容忍 度 ， 不 检查 其 他 进入 标准 ， 让 所 有 变量 都 进入 回归 方程 
向 前 ， 有 条 件 选择 此 项 ， 则 采用 向 前 选择 的 方法 来 选择 协 变量 ， 协 变量 进入 回归 方程 的 标准 是 分 值 统 
计量 的 显著 性 ， 删 除 标准 是 条 件 参数 估计 的 似 然 率 统计 量 的 概率 值 
商 前 ;及 选择 此 项 ， 则 采用 向 前 选择 的 方法 来 选择 协 变量 ， 协 变量 进入 回归 方程 的 标准 是 分 值 统 
计量 的 显著 性 ， 删 除 标准 是 极 大 似 然 估计 的 似 然 率 统计 量 的 概率 值 
向 前 : 瓦尔 德 选择 此 项 ， 则 采用 向 前 选择 的 方法 来 选择 协 变量 ， 协 变量 进入 回归 方程 的 标准 是 分 值 统 
计量 的 显著 性 ， 删 除 标准 是 瓦尔 德 统计 量 的 概率 值 
向 后 ， 有 条 件 选择 此 项 ， 则 采用 向 后 选择 的 方法 来 选择 协 变量 ， 协 变量 进入 回归 方程 的 标准 是 分 值 统 
计量 的 显著 性 ， 删 除 标准 是 条 件 参数 估计 的 似 然 率 统计 量 的 概率 值 
向 后 ，IR 选择 此 项 ， 则 采用 向 后 选择 的 方法 来 选择 协 变量 ， 协 变量 进入 回归 方程 的 标准 是 分 值 统 
计量 的 显著 性 ， 删 除 标准 是 极 大 似 然 估计 的 似 然 率 统计 量 的 概率 值 
向 后 ， 瓦 尔 德 选择 此 项 ， 则 采用 向 后 选择 的 方法 来 选择 协 变量 ， 协 变量 进入 回归 方程 的 标准 是 分 值 统 
计量 的 显著 性 ， 删 除 标准 是 瓦尔 德 统计 量 的 概率 值 
值得 注意 的 是 ， 协 变量 可 以 分 别 放 在 不 同 Gas saras > 
的 列表 框 中 ， 以 分 别 设置 协 变量 进入 回归 方程 ,ge ee 


的 方式 。“ 协 变量 ”列表 框 上 方 有 “上 一 个 ” 
和 “下 一 个 ”两 个 按钮 ， 若 有 两 个 协 变量 列表 
框 ， 且 当前 显示 的 是 第 1 个 列表 框 ， 则 “上 一 凶 
个 ”按钮 上 方 应 显示 “ 块 11” 字 样 。 

四 “分 类 ”按钮 ”当选 入 两 个 以 上 协 变量 一 
或 交互 项 上 且 其 中 部 分 协 变量 是 字符 串 变量 或 分 EE hp 
类 变量 时 ，“ 分 类 ”按钮 将 呈现 出 激活 状态 ， 
单 击 该 按钮 ， 弹 出 如 图 16-27 所 示 “Cox 回归 ; 
定义 分 类 协 变量 ”对 话 框 。 图 16-27 “Cox 回归 : 定义 分 类 协 变量 ”对 话 框 


。 “ 协 变量 ”列表 框 : 该 列表 框 中 列 出 在 主 对 话 框 中 选 入 的 所 有 协 变量 。 无 论 是 直接 指定 的 
协 变量 还 是 作为 交互 的 一 部 分 在 任何 层 中 指定 的 协 变量 ， 如 果 其 中 部 分 协 变量 是 字符 串 变 
量 或 分 类 变量 ， 则 能 将 它们 用 作 分 类 协 变量 。 

e “分 类 协 变量 ”列表 框 : 该 列表 框 列 出 标识 为 分 类 变量 的 变量 。 每 个 变量 都 在 括号 中 包含 
一 个 表示 法 ， 指 示 要 使 用 的 对 比 编码 。 字 符 串 变 量 已 存在 于 “分 类 协 变量 ”列表 框 中 。 可 
从 “ 协 变 量 ” 列 表 框 中 选择 其 他 任意 分 类 协 变量 并 将 它们 移 到 “分 类 协 变量 ”列表 框 中 。 

。 “更 改 对 比 ” 选 项 组 : 该 选项 组 用 于 更 改 对 比方 法 ，“ 对 比 ” 下 拉 列 表 框 中 可 用 的 对 比方 
法 如 表 16-6 所 示 。 


白 儿 及 者 


表 16-6 “对 比 " 方法 

区 到 | 含义 

指示 符 ”| 选择 此 项 ， 则 表示 对 比 指示 类 别 成 员 资 格 是 否 存在 。 参 考 类 别 在 对 比 秆 阵 中 表示 为 一 排 0 
简单 | 选择 此 项 ， 则 表示 除 参考 类 别 外 ， 预 测 变 量 的 每 个 类 别 都 与 参考 类 别 相 比 较 
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( 续 表 ) 


方法 含义 

选择 此 项 ， 则 表示 除 第 一 个 类 别 外 ， 预 测 变量 的 每 个 类 别 都 与 前 面 的 类 别 的 平均 效应 相 比 较 
也 称 为 逆 赫 尔 默 特 对 比 

赫 尔 默 特 | 选择 此 项 ， 则 表示 除 最 后 一 个 类 别 外 ， 预 测 变量 的 每 个 类 别 都 与 后 面 的 类 别 的 平均 效应 相 比较 
重复 选择 此 项 ， 则 表示 除 第 一 个 类 别 外 ， 预 测 变量 的 每 个 类 别 都 与 它 前 面 的 那个 类 别 进行 比较 
多 项 式 | 选择 此 项 ， 则 表示 进行 正 交 多 项 式 对 比 。 假 设 类 别 均匀 分 布 。 多 项 式 对 比 仅 适 用 于 数值 变量 
偏差 选择 此 项 ， 则 表示 除 参考 类 别 外 ， 预 测 变 量 的 每 个 类 别 都 与 总 体 效应 相 比较 


如 果 选 择 “ 偏 差 ” “简单 ”或 “指示 符 ” 选 项 ， 则 可 以 在 “参考 类 别 ” 选 项 组 中 选择 “最 
后 一 个 ”或 “第 一 个 ” 单 选 按钮 ， 表 示 以 最 后 一 个 或 第 一 个 作为 参考 类 别 。 注 意 , 直到 单 击 “ 更 
改 ” 按 钮 后 ， 该 方法 才 实 际 发 生 更 改 。 


另外 ,字符 串 协 变量 必须 是 分 类 协 变量 要 从 | ” 2 
“分 类 协 变量 ” 列表 框 中 移 去 菜 字 符 串 变 量 ,必须 D998 sone 
从 主 对 话 框 中 的 “ 协 变量 ”列表 框 中 移 去 所 有 包含 | 了 
该 变量 的 项 。 oe om 

@@ “ 层 ” 列表 框 。 用 于 先入 分 层 变量 ,可 以 国 jaaaaeeeao 
看 作 是 研究 者 欲 加 以 控制 的 混杂 因素 , 对 其 中 每 个 
取 值 水 平分 别 进行 分 析 。 

@@“ 图 "按钮 。 单 击 该 按钮 , 可 弹出 如 图 1628 | 2 9， 
所 示 的 “Cox 回归 ;图 ”对 话 框 i 


。 “图 类 型 ” 选项 组 : 用 于 选择 要 输出 的 图 像 ， 
具体 内 容 如 表 16-7 所 示 。 16-28 “Cox 回归 :图 ”对 话 杠 


表 16-7 Cox 回归 方法 的 图 类 型 


选中 该 复 选 框 ， 则 会 输出 在 线性 刻度 上 显示 的 累积 生存 函数 曲线 


选中 该 复 选 框 ， 则 会 输出 在 线性 刻度 上 显示 的 累积 风险 函数 
选中 该 复 选 框 ， 则 会 输出 以 线性 刻度 绘制 的 一 减 生存 函数 曲线 
负 对 数 的 对 数 选中 该 复 选 框 ， 则 会 输出 向 估计 应 用 了 In 〈-In) 转换 之 后 的 累积 生存 估计 曲线 


。 “ 协 变量 值 的 绘制 位 置 ”和 “针对 下 列 各 项 绘制 单独 的 线条 ”列表 框 : 在 “图 类 型 ”选项 
组 中 选择 任意 一 种 图 形 类 型 后 ， 下 方 的 “ 协 变量 值 的 绘制 位 置 ” 列 表 框 将 被 激活 ， 该 列表 
框 呈现 所 有 已 选 协 变量 。 从 中 选择 分 类 协 变 量 进入 右边 的 “ 针对 下 列 各 项 绘制 单独 的 线 
条 ”列表 框 中 ，SPSS 按 其 变量 值 将 数据 分 组 ， 并 按 组 生成 图 形 。 
。 “更 改 值 ”选项 组 : 因为 “图 类 型 ”选项 组 所 示 函 数 依赖 于 协 变量 的 值 ， 所 以 必须 对 协 变 
量 使 用 常数 值 来 绘制 函数 与 时 间 的 关系 图 。 
若 选中 “平均 值 ” 单 选 按钮 ， 则 表示 使 用 每 个 协 变量 的 平均 值 作 为 常数 ; 若 选中 “ 值 ” 单 
选 按钮 ， 则 可 在 后 面 的 文本 框 中 输入 自 定义 值 用 于 绘图 。 不 管 选中 的 是 “平均 值 ” 还 是 “ 值 ” 
单 选 按钮 ， 均 应 单 击 “变化 量 ” 按 钮 确认 使 用 。 
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@ “保存 ”按钮 。 单 击 该 按钮 ， 弹 出 如 图 16-29 所 示 的 “Cox 回归 : 保存 ”对 话 框 。 


息 cox 回 昌 : 保 和 


保存 模型 交 鱼 
| 

同 生存 分 析 醒 数 的 标准 误差 (S) 
已 生存 分 析 范 教员 对 吉 的 X 邱 山 


将 村 型 信息 导出 到 XML 文件 
文件 E): 


16-29 “Cox 回归 : 保存 ”对 话 框 
“保存 模型 变量 ”选项 组 用 于 选择 要 保存 的 函数 形式 ， 各 种 函数 介绍 如 表 16-8 所 示 。 


表 16-8 Cox 回归 的 保存 函数 
选项 含义 
生存 分 析 函 数 用 于 保存 累积 生存 概率 估计 ， 默 认 变 量 名 为 前 缀 sur_ 加 上 顺序 号 
生存 分 析 函 数 的 标准 误差 用 于 保存 累积 生存 估计 的 标准 误差 ， 默 认 变 量 名 为 前 级 se_ 加 上 顺序 号 
用 于 保存 输出 向 估计 应 用 了 jn 〈-In) 转换 之 后 的 累积 生存 估计 ， 默 认 变量 


生存 分 析 函 数 负 对 数 的 对 数 名 为 前 级 tml 加 上 顺序 号 
风险 函数 用 于 保存 累积 风险 函数 估计 ， 默 认 变量 名 为 前 级 haz 加 上 顺序 号 
偏 残 差 用 于 保存 生存 时 间 的 偏 残 差 ， 默认 变量 名 为 前 级 pr 加 上 顺序 号 
DfBeta 用 于 保存 Beta 系数 ， 默 认 变量 名 为 前 缀 dfb 加 上 顺序 号 
X*Beta 用 于 保存 线性 预测 因素 分 值 ， 默 认 变 量 名 为 前 缀 xbe_ 加 上 顺序 号 
“将 模型 信息 导出 到 XML 文件 ”选项 组 ， 用 于 把 模型 信息 以 XML 文件 的 形式 保存 到 指 
定 文件 中 。 
@ “选项 ”按钮 。 单 击 该 按钮 ， 弹 出 如 图 16-30 所 示 的 “Cox 回归 : 选项 ”对 话 框 。 
蛤 cox 回 昌 : 选项 X 
模型 统计 「 步 进 概率 
回 |Ep(6) 的 轩 信 区 间 二 “| % 进入 (VD: [05 。] 除去 W): 
回 信和 算 值 的 相关 性 (R) 
显示 模型 信息 
加 大 四 Rie: [po] 
加 显示 基线 函数 B) 
a) Lm La 


图 16-30 “Cox 回归 : 选项 ”对 话 框 
。 “模型 统计 ”选项 组 : 该 选项 组 用 于 选择 获得 模型 参数 的 统计 量 ， 包 括 “Exp(B) 的 置信 区 
间 ” 和 “估算 值 的 相关 性 ”两 个 复 选 框 。 选择 前 者 ， 可 在 后 面 的 文本 框 中 设置 不 同 的 置信 
水 平 ， 以 输出 相应 的 置信 区 间 ， 默 认 置信 水 平 为 95%; 选择 后 者 ， 则 表示 输出 回归 系数 的 
相关 系数 矩阵 。 
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。 “显示 模型 信息 ”选项 组 : 该 选项 组 用 于 设置 需要 显示 的 模型 信息 : 若 选中 “在 每 个 步骤 ” 
单 选 按钮 ， 则 会 在 每 一 步 进 入 过 程 中 都 输出 相关 统计 量 ; 若 选中 “在 最 后 一 个 步骤 ” 单 选 
按钮 ， 则 会 输出 最 后 的 回归 模型 的 相关 统计 量 。 

日 “ 步 进 概率 ”选项 组 : 如 果 选 择 了 逐步 推进 方法 ,用户 可 以 指定 模型 的 输入 或 剔除 的 概率 。 
如 果 变 量 进 入 下 的 显著 性 水 平 小 于 “进入 ” 值 ， 则 输入 该 变量 ; 如 果 变 量 的 该 显著 性 水 平 
大 于 “除去 ” 值 ， 则 移 去 该 变量 。“ 进 入 ” 值 必 须 小 于 “除去 ” 值 。 

。 “最 大 迭代 次 数 ” 文 本 框 : 用 于 指定 模型 的 最 大 迭代 次 数 ， 以 控制 过 程 求解 的 时 间 ， 系 统 
默认 为 20 次 。 

e “显示 基线 函数 ” 复 选 框 : 选中 该 复 选 框 ， 则 将 显示 协 变量 均值 下 的 基线 风险 函数 和 累积 
生存 函数 。 如 果 指 定 了 依 时 协 变 量 ， 则 此 显示 不 可 用 。 


3) 输出 结果 。 
所 有 设置 结束 后 ，“ 确 定 ” 按 钮 ， 即 可 输出 Cox 回归 分 析 结 果 。 


16.4.3 ”实验 操作 


下 面 将 以 “16-3” 数 据 文件 为 例 ， 讲解 Cox 回归 分 析 的 具体 操作 过 程 并 对 输出 结果 进行 说 明 。 
1. 实验 数据 描述 


“16-3” 数 据 文件 为 某 医 师 在 研究 白血病 患者 的 生存 率 时 收集 的 33 名 患者 的 资料 , 按 Ag 
阴阳 性 把 33 个 数据 文件 分 为 两 组 , 并 分 别 记录 了 两 组 患者 的 生存 月 数 , 是 否 死亡 及 白细胞 数 。 
我 们 将 利用 Cox 回归 分 析 过 程 , 得 到 白血病 患者 的 生存 函数 图 。“16-3 ”数据 文件 的 原始 Excel 
表 如 图 16-31 所 示 。 


ER PE 


J28 
A B C D 

Ag 阴 阳性 生存 时 间 (月 ) 是 否 死亡 ， 白细胞 玫 《 百 万 个 / 盈 升 血液 ) 
阳 1 是 100 


加 

Ph 滨 渐 浅 沉 涡 司 加 国 加 图 加 加 图 尽 必 国 避 加 届 加 国 
四 

天 向 向 币 定神 种 若 种 由 十 申 节 且 中 天 早生 时 向 册 
I 


16-31 “16-3” 数 据 文件 原始 数据 
在 SPSS 变量 视图 中 建立 “Ag 阴阳 性 ” “生存 时 间 ” “是 否 死亡 ”和 “白细胞 数 ”4 个 变 
量 ， 变 量 基 本 信息 如 图 16-32 所 示 。 
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起 *CDX 回 日 分析 sav 匡 强 和 1] - IBM SPSS Statistics 教 避 各 到 天 一 口 x 


文件 四 坑 旺 日 查看 VV) 教 据 D) 转换 〇 分 析 C 直销 叫 ) 图 HKS) 六 用 程序 扩展 CO 亩 口 QN) 帮助 时 ) 


名 称 | 型 ， 更 度 | 小 数位 数 | 标签 | 值 冤 失 | 列 | 对齐 和 量 角色 


蕊 
|jAg 阴 阳性 炒 字 11 0 无 无 8 性 右 未 知 输入 
2 | 生存 时 间 数字 11 0 无 无 10 性 右 未 各 输入 
3 ”| 是 到 死亡 数字 作 0 无 无 1 看 右 未 知 输入 
4 | 提 细 胸 数 ”数字 11 0 无 无 加 沽 右 未 各 AN 令 入 
3 
8 
9 


[ TB SPSS Statistics 处 理 程 序 六 二 | | [UnicodeON| | 
图 16-32 “16-3” 数 据 文件 的 变量 视图 
然后 在 SPSS 数据 视图 中 输入 相应 的 变量 值 ， 其 中 ， 在 “Ag 阴阳 性 ”变量 中 用 数字 0 和 1 


分 别 表示 阴 和 阳 ， 在 “是 否 死亡 ”变量 中 用 1 和 0 分 别 代表 是 和 和 否 ， 输 入 完毕 后 的 部 分 数据 如 
图 16-33 所 示 。 


赐 "Cox 四 日 9 怕 sav 牙 涤 集 1] - IBM SPss Statistics 数 汉 护 油 入 ot 口 x 


图 16-33 “16-3” 数 据 文件 的 数据 视图 
2. 实验 操作 步骤 
具体 操作 过 程 如 下 : 


本 507 在 菜单 栏 中 选择 “分 析 ”| “生存 分 析 ”|“Cox 回归 ”命令 ,弹出 “Cox 回归 ”对 话 框 。 
人 ES6? 从 左 侧 源 变 量 列表 框 中 选择 “生存 时 间 ” 变 量 , 先入“ 时间” 列表 框 作为 时 间 变 量 。 


393 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


ED 从 左 例 源 变 量 列表 框 中 选择 “是 否 死亡 ”变量 进入 “状态 ”列表 框 作为 状态 变量 ， 
然后 单 击 “ 定 义 事件 ”按钮 ， 弹 出 “Cox 回归 :为 状态 变量 定义 事件 ”对 话 框 ， 先 

中 “ 单 值 " 单 选 按钮 , 并 在 其 后 的 文本 框 中 输入 1 将 取 值 为 0 的 观测 作为 截断 观测 ， 
单 击 “ 继 续 ” 按钮。 

ESD 从 左 侈 源 变 量 列表 框 中 选 入 “Ag 阴阳 性 ”和 “白细胞 数 ”两 个 变量 到 “ 协 变量 ” 列 
表 框 中 ， 由 于 样本 数 较 少 ， 因 此 在 “方法 ”下 拉 列表 框 中 选择 “输入 ”选项 。 

GE 单 击 “ 分 类 ”按钮 ， 弹 出 “Cox 回归 : 定义 分 类 协 变量 ”对 话 框 ， 从 左 例 “ 协 变量 ” 
列表 框 中 将 “Ag 阴阳 性 ”变量 先入 “分 类 协 变量 ”列表 框 中 ， 其 他 均 采 用 默认 设置 ， 
设置 完毕 后 ， 单 击 “ 继 续 ”按钮 。 

EES 单 击 “ 图 ” 按钮 ， 弹 出 “Cox 回归 : 图 ”对话 框 ， 在 “图 类 型 ”选项 组 中 选中 “ 生 
存 分 析 ” 和 “风险 ” 复 选 框 ， 其 他 均 采用 默认 设置 。 

3. 实验 结果 及 分 析 


所 有 设置 完毕 后 ， 单 击 “确定 ”按钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 16-34~ 
图 16-39 所 示 。 

如 图 16-34 所 示 的 “个 案 处 理 摘 要 ”给 出 了 数据 的 简要 统计 信息 ， 其 中 “事件 ”和 “ 检 刚 
后 ”分 别 表示 事件 发 生 和 不 发 生 的 观测 次 数 。 个 案 处 理 摘要 还 给 出 了 缺失 案例 的 情况 ，33 个 
案例 中 有 29 个 患者 死亡 ，4 个 生存 下 来 ， 该 数据 文件 没有 任何 缺失 值 存在 。 

图 16-35 给 出 了 分 类 变量 “Ag 阴阳 性 ”的 统计 信息 ， 其 中 阴性 个 案 频 数 为 16， 阳 性 频数 


海 :17。 
个 案 处 理 摘要 
案 数 百分比 
可 以 在 分 新 中 使 用 的 个 案 。 事件 = 29 879% 分 类 变量 编码 a 
检测 后 4 12.1% 
纺 志 (1)° 
已 计 | 33 100.0% 一 一 
已 坦 除 的 个 家 具有 缺失 值 的 个 案 0 00% Ag 阳 加 性 * 0 16 1 

具有 负 时 间 的 个 案 0 0.0% 17 0 
层 中 最 旱 发 生 的 事件 之 前 0 00% a. 类别 变量 ， Ag 阴阳 性 
攻 有 后 让 家 b. 指示 符 参数 栓 码 
2 i .由 于 (0,1) 变量 已 重新 编码 ， 因 此 其 

3 100.0% 系数 不 会 与 指示 符 (0,1) 编码 的 系数 

a, 因 变 重 ， 生 存 时 间 相同 。 
图 16-34 案例 处 理 摘要 图 16-35 分 类 变量 信息 
图 16-36 给 出 了 模型 系数 的 有 关 检 验 结果 , 从 中 看 出 两 个 模块 中 系数 变化 在 10% 的 置信 度 
下 是 显著 的 。 
模型 系数 的 Omnibus 检验 
总 体 《 得 分 ) 从 上 一 步 进行 更 改 从 上 一 块 进行 更 改 
-2 对 数 似 然 卡 方 自由 度 显著 性 卡 方 自由 度 显著 性 卡 方 自由 度 显著 性 
142.761 11.773 2 003 10.633 2 005 10.633 2 .005 


a. 起 始 块 号 1。 方 法 = 输入 


图 16-36 模型 系数 显著 性 检验 
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图 16-37 给 出 了 协 变量 的 回归 系数 及 其 显著 性 检验 结果 ,由 图 可 知 ,两 个 变量 系数 在 10% 
置信 度 下 也 是 显著 的 。 另 外 ， 输 出 结果 还 包括 两 个 协 变量 的 均值 。 


方程 中 的 变量 协 变量 平均 值 (C) 

8 SE 瓦尔 德 自由 度 显著 性 Exp(B) 平均 值 
Ag 阴阳 性 1.122 .450 6.202 013 3.071 Ag 阴 阳性 485 
白细胞 数 .009 .005 2.970 1 .085 1.009 白 细 乃 数 29.167 


图 16-37 变量 系数 输出 结果 及 变量 均值 


16-38 给 出 了 白血病 患者 的 生存 函数 图 , 由 图 可 以 看 出 患者 的 生存 函数 下 降 速度 较 快 且 
有 明显 减 慢 趋 势 ， 接 近 160 个 月 时 ， 生 存 率 几乎 为 0。 


按 协 变量 平均 值 的 生存 分 析 函 数 


T T T 
9 名 10 1 


生存 时 间 
图 16-38 ”生存 函数 图 
图 16-39 给 出 了 白血病 患者 的 危险 函数 图 ， 其 趋势 也 十 分 明显 ， 即 随时 间 的 延长 ， 患 者 在 
生存 上 所 经 历 的 死亡 风险 越 来 越 大 ， 到 140 个 月 时 ， 大 约 是 起 初 的 5 倍 。 


按 协 变量 平均 值 的 风险 函数 


外 


生存 时 间 


图 16-39 危险 函数 图 
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16.5 上 机 题 


视频 文件 ，\Wwideo\ 上 机 题 教学 视频 \chap16 wmv 


16.1 25 例 癌症 病人 在 不 同时 期 经 随机 化 分 配 到 A、B 治疗 组 进行 治疗 ， 同 时 随访 观察 
至 2007 年 10 月 1 日 结束 ， 资 料 整理 后 如 下 表 ， 表 中 “是 否 死亡 ”变量 用 0、!1 分 别 代表 “ 否 
”和 “是 ”“ 治 疗 方式 ”变量 中 分 别 用 1、2 代表 A、B 两 种 治疗 方法 ， 试 对 其 结果 进行 生存 
率 分 析 。 (数据 路 径 : 视频 文件 \sample\ 上 机 题 \chap16\ 习 题 \ 第 16 章 第 一 题 .sav) 


病人 号 随访 天 数 〈 天 ) 治疗 方式 
8 


中 | 


视频 文件 ，\sample\ 上 机 题 chap16\ 


1 1 
本 180 1 2 
3 632 3 2 
4 852 0 1 
5 32 1 1 
6 2240 ll 人 2 
7 220 1 1 
8 63 1 1 
和 195 | 2 
10 76 | 2 
11 70 1 2 
设 8 1 1 
Lk 13 3 2 
14 1990 0 2 
15 1976 0 1 
16 18 1 2 
17 700 和 和 2 
18 1296 0 1 
19 1460 0 时 
20 210 1 2 
21 63 1 1 
22 1328 0 1 
23 1296 , 2 
24 365 0 1 
25 23 1 入 
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16.2 用 中 药 加 化 疗 和 单纯 化 疗 两 种 疗法 治疗 26 名 白血病 患者 后 ， 随 访 记录 存活 情况 如 
下 所 示 ，“ 是 否 死亡 ”中 分 别 用 0、1 代表 “ 否 ” 和 “是 ”“ 治 疗 方法 ”中 的 1、2 分 别 代 表 
“中 医 加 化 疗 方法 ?和 ”单纯 化 疗 方法 ”， 试 比较 两 组 的 生存 率 。( 数 据 路 径 : 视频 文件 \sample\ 
上 机 题 \chap16\ 习 题 \ 第 16 章 第 二 题 .sav) 


随访 月 数 ( 月 ) 是 否 死 亡 治疗 方法 

10 0 1 
2 1 1 
12 1 1 
13 0 i 
18 0 1 
6 
19 1 1 
26 0 i 
9 1 i 
8 1 1 
6 1 1 
43 1 1 
9 0 1 
4 0 1 
31 0 
24 0 1 
2 到 
13 0 2 
有 lL 2 
11 I 2 
6 0 2 
1 0 2 
11 0 2 
有 0 2 
1 0 
了 0 2 


16.3 以 下 数据 记录 了 50 名 白血病 人 外 周 血 中 的 细胞 数量 、 浸 润 等 级 、 巩 固 治疗 情况 、 
生存 时 间 和 状态 变量 。 下 表 给 出 了 其 中 部 分 数据 ， 其 中 “巩固 治疗 ”变量 中 ， 分 别 用 0、1 代 
表 “ 否 ”和 “是 ”“ 结 局 ”中 0 代表 “生存 ”，1 代表 “死亡 ”; “指示 变量 ”中 1 代表 “全 
部 数据 ”，0 代表 “ 截 尾数 据 ”。 试 用 Cox 分 析 方 法 ， 得 到 白血病 患者 的 生存 函数 图 。 (数据 
路 径 : 视频 文件 \sample\ 上 机 题 \chap16\ 习 题 \ 第 16 章 第 三 题 .sav) 
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白细胞 数 〈 万 个 ) 浸润 等 级 ”| 巩固 治疗 | 生存 时 间 (年 ) 结局 指示 变量 
25 0 0 3.4 0 1 
12 2 0 3.73 0 1 
173 2 0 3.73 0 
3.5 0 0 3.83 0 
119 2 0 4 0 1 
39.7 0 0 4.03 0 1 
10 2 0 4.17 0 1 
62.4 0 0 4.2 0 
502.2 到 0 4.2 0 1 
2.4 0 0 5 0 1 
4 0 0 1 
34.7 0 0 1 
14.4 0 0 1 
28.4 2 0 1 
2 2 0 ' 
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我 们 在 做 调查 问卷 时 , 最 看 重 的 是 调查 问卷 的 科学 性 和 有 效 性 。 信 度 分 析 方法 是 分 析 问 卷 
的 主题 是 否 符 合 调查 者 的 要 求 和 调查 数据 可 靠 性 的 专用 统计 方法 。 信 度 分 析 和 多 维 尺度 分 析 是 
两 种 常见 的 信 度 分 析 方 法 , 它们 是 探索 研究 事物 间 的 相似 性 或 不 相似 性 的 专用 技术 。 信 度 分 析 
是 用 于 检验 结果 的 一 贯 性 、 一 致 性 、 再 现 性 和 稳定 性 的 常用 方法 ; 多 维 尺度 分 析 是 研究 和 反映 
被 访 者 对 研究 对 象 相似 性 的 感知 的 一 种 统计 分 析 方 法 ，SPSS 提供 了 强大 的 信 度 和 多 维 刻度 分 
析 功 能 ， 下 面 将 对 其 进行 相应 的 介绍 。 


17.1 信和 度 分 析 


我 们 在 做 调查 问卷 时 , 最 看 重 的 是 调查 问卷 的 科学 性 和 有 效 性 , 如 果 一 个 问卷 设计 出 来 无 
法 有 效 地 考察 问卷 中 所 涉及 的 各 个 因素 ,那么 我 们 为 调查 问卷 所 作 的 抽样 、 调 查 、 分 析 、 结 论 
等 一 系列 的 工作 也 就 白 做 了 。 那么 , 如 何 来 检验 设计 好 的 调查 问卷 是 否 有 效 呢 ? 信 度 分 析 是 评 
价 调查 问卷 是 否 具有 稳定 性 和 可 靠 性 的 有 效 分 析 方 法 。 


17.1.1 ”信和 度 分 析 的 原理 


信 度 又 叫 可 靠 性 ， 是 指 问卷 的 可 信 程 度 。 它 主要 表现 检验 结果 的 一 贯 性 、 一 致 性 、 再 现 性 
和 稳定 性 。 一 个 好 的 测量 工具 ， 对 同一 事物 反复 多 次 测量 ， 其 结果 应 该 始终 保持 不 变 才 可 信 。 
例如 , 我 们 用 一 把 尺子 测量 一 张 桌子 的 高 度 ,今天 测量 的 高 度 与 明天 测量 的 高 度 不 同 ， 那 么 我 
们 就 会 对 这 把 尺子 产生 怀疑 。 因 此 ， 一 张 设 计 合 理 的 调查 问卷 应 该 具有 它 的 可 靠 性 和 稳定 性 。 

调查 问卷 的 评价 体系 是 以 量 表 形式 来 体现 的 ,编制 的 合理 性 决定 着 评价 结果 的 可 用 性 和 可 
信 性 。 问卷 的 信 度 分 析 包 括 内 在 信 度 分 析 和 外 在 信 度 分 析 。 内 在 信 度 重 在 考察 一 组 评价 项 目 是 
否 测量 同一 个 概念 ， 这些 项 目 之 间 是 否 具有 较 高 的 内 在 一 致 性 。 一 致 性 程度 越 高 ， 评 价 项 目 就 
越 有 意义 , 其 评价 结果 的 可 信和 度 就 越 强 。 外 在 信 度 是 指 在 不 同时 间 对 同 批 被 调查 者 实施 重复 调 
查 时 ,评价 结果 是 否 具 有 一 致 性 。 如 果 两 次 评价 结果 相关 性 较 强 , 说 明 项 目的 概念 和 内 容 是 清 
晰 的 ， 因 而 评价 的 结果 是 可 信 的 。 信 度 分 析 的 方法 有 多 种 ， 有 Alpha 信 度 和 分 半 信 度 等 ， 都 是 
通过 不 同 的 方法 来 计算 信 度 系数 ， 再 对 信 度 系数 进行 分 析 。 

目前 常用 的 是 Alpha 信 度 系数 法 , 一 般 情 况 下 , 我 们 主要 考虑 量 表 的 内 在 信 度 一 一 项 目 之 
间 是 否 具有 较 高 的 内 在 一 致 性 。 通 常 认为 ， 信 度 系 数 应 该 在 0~1 之 间 ， 如 果 量 表 的 信 度 系数 
在 0.9 以 上 ， 表 示 量 表 的 信 度 很 好 ; 如果 量 表 的 信 度 系数 在 0.8~0.9 之 间 ， 表 示 量 表 的 信 度 可 
以 接受 ， 如 果 量 表 的 信 度 系数 在 0.7~0.8 之 间 ， 表 示 量 表 有 些 项 目 需要 修订 ;如 果 量 表 的 信 度 
系数 在 0.7 以 下 ， 表 示 量 表 有 些 项 目 需要 抛弃 。 
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17.1.2 ”信和 度 分 析 的 SPSS 操作 


打开 相应 的 数据 文件 或 者 建立 一 个 数据 文件 后 ， 就 可 以 在 SPSS Statistics 数据 编辑 器 窗口 
中 进行 信 度 分 析 。 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 标 度 ”|“ 可 靠 性 分 析 ” 命 令 ， 打 开 如 图 17-1 所 示 的 “可 

2) 选择 变量 。 

从 源 变 量 列表 框 中 选择 需要 分 析 的 变量 ， 单 击 国 按钮 将 选中 的 变量 先入 “项 ”列表 框 中 。 
“项 ”列表 框 中 的 变量 数据 可 以 是 二 分 数据 、 有 序数 据 或 区 间 数 据 , 但 数据 应 是 用 数值 编码 的 ， 
且 信 和 度 分 析 需 要 选择 两 个 或 两 个 以 上 的 变量 进入 “项 ”列表 框 。 选择 完 需 要 分 析 的 变量 后 的 对 
话 框 如 图 17-2 所 示 。 


息 可 案 性 分 x 
图 ET 
| 对 
ma | 2 
] 
Ce] he Ee Go Eu (ae ] EE 
图 17-1 “可 靠 性 分 析 ” 对 话 框 图 17-2 选择 需要 分 析 的 变量 
3) 进行 相应 的 设置 。 


“统计 ”设置 
单 击 “ 统 计 ” 按 钮 ， 弹 出 “可 靠 性 分 析 : 统计 ”对 话 框 ， 如 图 17-3 所 示 。 
“可 靠 性 分 析 : 统计 ”对 话 框 主要 用 于 对 度量 和 项 


息 可 咎 性 分 析 : 统计 x 
的 一 些 统计 量 的 设置 。 
握 壕 项 之 间 
Q@ “描述 ”选项 组 。 该 选项 组 用 于 为 个 案 的 标 度 | 到。 PR 
或 项 生成 描述 统计 ， 包 括 以 下 几 个 复 选 框 : tome 
。 项 : 选中 该 复 选 框 ， 表 示 为 个 案 的 每 个 项 生成 描 。 |igaw a 
述 统计 量 ， 如 均值 、 标 准 差 等 。 日 jw OE 
。 标 度 : 选中 该 复 选 框 ， 表 示 为 标 度 产生 描述 统计 。 “| 


量 ， 即 各 个 项 之 和 的 描述 统计 量 。 回 大 格林 T 平 方 (G) 让 图 昌 可 加 性 检验) 
。 删除 项 后 的 标 度 : 选中 该 复 选 框 ， 表 示 输 出 将 每 SD 
一 项 与 由 其 他 项 组 成 的 标 度 进行 比较 时 的 摘要 统 ee 
计量 ， 即 该 项 从 标 度 中 删除 时 的 标 度 均 值 和 方差、 
该 项 与 由 其 他 项 组 成 的 标 度 之 间 的 相关 性 ， 以 及 
该 项 从 标 度 中 删除 后 的 Cronbach's alpha 值 。 17-3 “可 靠 性 分 析 : 统计 ”对 话 框 
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@ “项 之 间 ” 选 项 组 。 该 选项 组 用 于 对 输出 项 之 间 的 相关 矩阵 进行 设置 ， 包 括 : 


。 相关 性 : 选中 该 复 选 框 ， 表 示 输 出 项 与 项 之 问 的 相关 性 矩阵 。 
。 协 方差 : 选中 该 复 选 框 ， 表 示 输 出 项 与 项 之 间 的 协 方差 矩阵 。 


@ “摘要 ”选项 组 。 该 选项 组 用 于 设置 标 度 中 所 有 项 的 统计 量 ， 包 括 以 下 几 个 量 : 


。 平均 值 : 选中 该 复 选 框 ， 表 示 输 出 所 有 项 均值 的 最 小 值 、 最 大 值 、 平 均值 、 项 均值 的 范围 
方差 ， 以 及 最 大 项 均值 与 最 小 项 均值 的 比 。 

。 方差 : 选中 该 复 选 框 ， 表 示 输 出 所 有 项 方差 的 最 小 值 、 最 大 值 、 平 均值 、 项 方差 的 范围 、 
方差 ， 以 及 最 大 项 方差 与 最 小 项 方差 的 比 。 

。 协 方差 : 选中 该 复 选 框 ， 表 示 输 出 项 之 间 的 协 方差 的 最 小 值 、 最 大 值 、 平 均值 、 项 之 间 的 
协 方差 的 范围 、 方 差 ， 以 及 最 大 项 之 间 协 方差 与 最 小 项 之 间 的 协 方差 的 比 。 

。 相关 性 : 选中 该 复 选 框 , 表示 输出 所 有 项 之 间 的 相关 性 的 最 小 值 、 最 大 值 、 平 均值 、 范围 
方差 ， 以 及 最 大 项 之 间 的 相关 性 与 最 小 项 之 间 的 相关 性 的 比 。 


@@ “ANOVA 表 ” 选 项 组 。 该 选项 组 用 于 选择 方差 分 析 与 均值 是 否 相等 的 检验 ， 可 选 的 
项 有 : 


。 无 : 表示 不 进行 任何 检验 。 

。 下 检验 : 表示 进行 重复 度量 方差 分 析 。 

。 传 莱 德 曼 卡 方 : 表示 进行 非 参 数 检验 中 的 多 配对 样本 传 莱 德 曼 检验 ， 并 输出 传 莱 德 曼 的 
卡 方 肯 德 尔 的 协同 系数 。 此 选项 适用 于 以 秩 为 形式 的 数据 且 卡 方 检验 在 ANOVA 表 中 替 
换 通常 的 F 检验 。 

。 柯 克 兰 卡 方 : 表示 进行 非 参 数 检验 中 的 多 配对 样本 柯 克 兰 s 检验 ， 并 输出 柯 克 兰 s Q。 此 
选项 适用 于 双 分 支 数据 且 Q 统计 在 ANOVA 表 中 替换 通常 的 F 统计 。 


@@“ 霍 特 林 工 平方 ” 复 选 框 。 选 中 该 复 选 框 ， 表示 输出 多 变量 霍 特 林 了 平方 检验 统计 量 ， 
该 检验 的 原 假设 是 标 度 上 的 所 有 项 具有 相同 的 均值 ， 如 果 该 统计 量 的 概率 值 在 5% 的 显著 水 平 
上 拒绝 原 假设 ， 则 表示 标 度 上 至 少 有 一 个 项 的 均值 与 其 他 项 不 同 。 

@ “图 基 可 加 性 检验 ” 复 选 框 。 选 中 该 复 选 框 ， 表 示 进 行 图 基 的 可 加 性 检验 ， 该 检验 的 
原 假 设 是 项 中 不 存在 可 乘 交互 作用 ， 如 果 该 统计 量 的 概率 值 在 5% 的 显著 水 平 上 拒绝 原 假设 ， 
则 表示 项 中 存在 可 乘 的 交互 作用 。 

@ “同类 相关 系数 ” 复 选 框 。 选 中 该 复 选 框 ， 表 示 计 算 组 内 同类 相关 系数 ， 对 个 案 内 值 
的 一 致 性 或 符合 度 的 检验 。 选 中 该 复 选 框 后 ， 相 应 的 选项 都 被 激活 。 


。 “模型 ” 下拉 列表 框 : 该 列表 框 给 出 了 用 于 计算 同类 相关 系数 的 模型 。“ 双 向 混合 ”模型 ， 
当 人 为 影响 是 随机 的 而 项 的 作用 固定 时 ， 选 择 该 模型 ; “双向 随机 ”模型 ， 当 人 为 影响 和 
项 的 作用 均 为 随机 时 选择 该 模型 ; “单项 随机 ”模型 ， 当 人 为 影响 随机 时 选择 该 模型 。 

。 “类 型 ”下 拉 列 表 框 : 可 以 选择 “一 致 性 ”或 “绝对 一 致 ”。 

。 “置信 区 间 ” 文 本 框 : 用 于 指定 置信 区 间 的 范围 ， 系 统 默认 为 95%。 

。 “检验 值 ” 文本 框 : 用 于 指定 假设 检验 系数 的 假设 值 , 该 值 是 用 来 与 观察 值 进行 比较 的 值 ， 
系统 默认 为 0。 
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设置 分 析 模型 
“模型 ”下 拉 列 表 框 主要 用 于 选择 进行 信 度 〈 可 靠 性 ) 分 析 的 模型 ， 有 以 下 几 个 选项 : 


Alpha: 即 Cronbach 模型 ， 该 模型 是 内 部 一 致 性 模型 ， 用 于 输出 Cronbach"s alpha 值 。 
折 半 : 即 半分 信 度 模型 ， 该 模型 将 标 度 分 割 成 两 个 部 分 ， 并 检查 两 部 分 之 间 的 相关 性 。 
格 特 曼 : 即 格 特 曼 模 型 ， 该 模型 计算 格 特 曼 的 下 界 以 获取 真实 可 靠 性 。 

平行 : 即 平行 模型 ， 该 模型 假设 所 有 项 具有 相等 的 方差 ， 并 且 重 复 项 之 间 具 有 相等 的 误差 
方差 ， 进 行 模型 的 拟 合 度 检验 。 

e 严格 平行 : 即 严格 平行 模型 ， 该 模型 不 仅 有 平行 模型 的 假设 ， 还 假设 所 有 项 具有 相等 的 均 
值 ， 输 出 公共 均值 、 公 共 方差 、 真 实 方差 、 误 差 方差 等 统计 量 。 


4) 分 析 结 果 输 出 。 
设置 完毕 后 , 单 击 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 信 度 分 析 的 结果 。 


17.1.3 ”实验 操作 


下 面 将 以 “17-1” 数 据 文件 为 例 ， 讲 解 信 度 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 

1. 实验 数据 描述 

“17-1” 数 据 文件 涉及 某 家 电 公 司 对 消费 者 在 何 种 情况 下 使 用 自己 公司 产品 的 调查 结果 ， 
在 数据 文件 中 , 每 行 代表 一 位 单独 的 调查 对 象 ; 每 列 代表 一 种 单独 的 情况 。 该 调查 问卷 共 设置 
了 7 种 情况 ， 分 别 为 “总 是 使 用 ”“ 没 有 其 他 品牌 ”“ 有 电视 广告 ”“ 有 其 他 人 使 用 ”“ 公 司 
上 市 ”“ 常 推出 新 产品 ”和 “现任 总 裁 在 职 ”。 被 调查 者 对 每 种 情况 做 出 “是 ”或 “ 否 ” 的 选 
择 , 共有 906 行 数 据 。 我 们 将 利用 信 度 分 析 过 程 ， 得 出 调查 结果 是 否 可 信 的 结论 ， 该 数据 文件 
的 原始 Excel 表 如 图 17-4 所 示 。 


A B C D 3 FF 四 
1_| 总 是 使 用 没有 其 他 品牌 本 和 | 机 人 信用 公司 上 市 常 推出 新 产品 现任 总 栽 在 职 


到 


是 
是 
是 
是 
是 
否 
9 | 是 
是 
和 否 
和 否 
否 
否 
是 
是 
是 
是 
是 
是 


ee 
Bo ee 
币 币 和 江河 吓 叫 苞 沌 币 向 测 灌 秃 生 二 江 
症 宙 各 并 入 各 向 叫 号 币 币 由 出 和 种 并重 滞 肌 
并 并 并 币 宦 汗 事 电量 入 和 江油 汕 种 并 汪 汪汪 
半 并 并 秃 汕 并 到 叫 号 漠 秃 汕 汕 汕 种 症 并 沌 并 


图 17-4 “17-1” 数据 文件 的 原始 数据 


首先 在 SPSS 变量 视图 中 建立 “总 是 ”“ 其 他 品牌 ”“ 广 告 ”“ 他 人 使 用 ”“ 上 市 ”“ 新 
产品 ”和 “在 职 ”7 个 变量 ,分 别 代表 “总 是 使 用 ”“ 没 有 其 他 品牌 ”“ 有 电视 广告 ”“ 有 其 
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他 人 使 用 ”“ 公 司 上 市 ”“ 常 推出 新 产品 ”和 “现任 So 7 种 情况 ， 每 个 变量 中 用 0 和 
1 分 别 代表 “ 否 ” 和 “是 ”， 所 有 变量 的 度量 标准 均 为 “度量 ”。“17-1” 数 据 文件 的 变量 视 
图 如 图 17-5 所 示 。 


起 六 SWf sav 加 本 11 -BM spss Statistics 下 天 守 二 和 - 口 忒 
文件 四。 卓 加 机 而。 寺 扬 D) 转 术 中。 分析。 让 光 山本 HG 志 用 得 序 W。 坟 归 0 亩 DQ 帮 肋 由 ) 


和 


17-5 “17-1” 数 据 文件 的 变量 视图 
然后 在 SPSS 数据 视图 中 输入 相应 变量 的 数据 ， 输 入 完毕 后 的 部 分 数据 如 图 17-6 所 示 。 


国信 分 析 sov | 琶 蚁 1] - 6M SPS5 Statistics 下 所 攀 本 oO x 
XHO NUD BEV MMO WAD I BWW EG) FMP FR BAW WW 


PTT TFB FuB 


1 


0 
1 
1 
1 
1 
1 
D 
1 
1 
1 
0 
o 
0 
1 
1 
1 


PSS Solstics 外 至 条 络 绩 “|Unicode ON | 


17-6 “17-1” 数 据 文件 的 数据 视图 


2. 实验 操作 步骤 


ES56i 打开 “17-1” 数 据 文 件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 析 ” 
| “度量 ”| “可 靠 性 分 析 ” 命 令 ， 弹 出 “可 靠 性 分 析 ” 对 话 框 ， 然 后 将 “总 是 ”“ 其 他 
品牌 ” “广告 ”“ 他 人 使 用 ”“ 上 市 ”“ 新 产品 ”和 “在 职 ” 选 入 “项 目 ”列表 框 中。 

人 ES362 单 击 “ 统 计 ” 按 钮 ， 弹 出 “可 靠 性 分 析 : 统计 ”对 讲 框 ， 选 中 “项 “相关 性 ”“ 平 
均值 ” 复 选 框 ， 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 结果 。 
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ES63 在 “模型 ”下 拉 列 表 框 中 选择 “Alpha” 模 型 ， 也 可 以 选择 其 他 模型 形式 。 
3. 实验 结果 及 分 析 


单 击 “ 确 定 ” 按 钮 ，SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 17-7~ 图 17-11 所 示 。 

17-7 给 出 了 个 案 处 理 摘要 , 从 中 可 以 看 到 整个 数据 文件 共有 906 个 个 案 参与 信 度 分 析 ， 
并 无 缺失 值 。 

图 17-8 给 出 了 信 度 分 析 的 可 靠 性 统计 量 结果 ， 从 中 可 以 看 到 克隆 巴赫 Alpha 值 为 0.898， 
基于 标准 化 项 的 克隆 巴赫 Alpha 值 为 0.894， 两 个 系数 值 都 在 90% 附 近 ， 可 见 该 量 表 具 有 很 高 
的 内 在 一 致 性 ， 所 以 可 靠 性 较 强 。 

17-9 给 出 了 各 个 项 的 基本 统计 量 ， 从 中 可 以 看 到 每 个 项 的 平均 值 、 标 准 差 和 个 案 数目 。 
如 其 4 个 项 的 均值 都 在 0.5 左右 ， 表 明 大 约 50% 的 人 出 于 前 4 个 项 的 原因 选择 继续 收看 节目 。 


项 统计 
二 均值 。 标准 差 | 个 案 数 
个 案 处 理 摘要 总 是 49 500 906 
个 下 % 其 他 品牌 50 .500 906 
个 案 。 有 效 906 1000 广告 50 500 906 
排除 * 0 0 他 人 使 用 53 499 906 
上 市 81 389 906 
a 0 00D 数 新 产品 83 378 906 
a. 基于 过 程 中 所 有 变 各 的 成 列 生 

除 。 | 4%| 7 是 89 315 906 

17-7 个 案 处 理 摘要 17-8 可靠 性 统计 量 结果 17-9 项 统计 量 


图 17-10 给 出 了 项 间 的 相关 性 矩阵 ， 从 中 可 以 看 到 每 个 项 之 间 的 相关 系数 。 如 第 一 项 与 第 
二 、 第 三 、 第 四 项 间 的 相关 性 都 比较 高 ， 而 第 五 项 与 第 六 、 第 七 项 间 的 相关 性 较 高 。 


项 间 相 关 性 矩阵 
总 是 其 他 品牌 广告 他 人 使 用 上 市 新 产品 在 利 
总 是 1.000 815 813 .782 408 421 ,303 
其 他 品牌 815 1.000 826 807 422 423 .307 
广告 .813 826 1.000 804 458 453 336 
他 人 使 用 782 807 804 1.000 443 460 340 
上 市 408 422 458 443 1.000 632 625 
新 产品 421 423 453 460 632 1.000 .600 
在 职 -303 -307 336 340 625 600 1.000 


图 17-10 ”项 间 相关 性 矩阵 
图 17-11 给 出 了 摘要 项 统计 量 图 。 该 图 中 显示 了 所 有 项 均值 的 最 小 值 、 最 大 值 、 平 均值 、 


全 距 、 方 差 及 最 大 值 与 最 小 值 的 比 。 所 有 项 均值 的 平均 值 是 0.650， 不 严格 地 来 说 ， 在 各 种 情 
况 下 ， 大 约 有 65% 的 人 会 选择 继续 收看 这 个 电视 节目 。 


摘要 项 统计 
最 大 值 1 最 小 
平均 值 。 最 小 值 。。 最 大 什 全 中 值 广 关 项 数 
现 平 均值 650 487 889 402 1.825 033 7 


图 17-11 摘要 项 统计 量 
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4. 对 信 度 模型 的 进一步 探讨 
在 “模型 ”下 拉 列 表 框 中 除了 可 以 选择 “Alpha” 模 型 ， 也 可 以 选择 其 他 模型 形式 ， 图 
17-12 和 图 17-13 分 别 展示 了 “ 格 特 曼 ”《〈 格 特 曼 模型 ) 选项 和 “ 折 半 ”《 半 分 信 度 模型 ) 选项 


的 输出 结果 。 
可 靠 性 统计 


克隆 巴 昔 Apha 。。 第 一 部 分 值 944 
项 数 4 
第 二 部 分 值 826 
可 靠 性 统计 = 
Lambda 1 769 pr 7 
2 15 形 专 之 同 的 相关 性 503 
3 898 斯 皮尔 县 -布朗 系数 。 等 长 669 
4 .577 673 
5 894 577 
8 927 5, 他 人 使 用 
项 数 7 
图 17-12 格 特 曼 模型 的 可 靠 性 统计 量 图 17-13 半分 信 度 模型 的 可 靠 性 统计 量 


图 17-12 为 格 特 曼 模型 的 信 度 分 析 结 果 图 。 该 图 给 出 了 基于 格 特 曼 模型 计算 的 从 Lambdal 
到 Lambda6 的 6 个 信 度 系数 。 在 6 个 信 度 系数 中 最 高 的 是 Lambda6， 其 中 Lambda3 恰好 等 于 图 
17-8 中 的 克隆 巴赫 Alpha 值 。 但 是 由 于 该 系数 计算 较为 复杂 ， 因 此 实际 应 用 中 并 不 普遍 。 

图 17-13 为 半分 信 度 模型 的 信 度 分 析 结 果 。 从 该 图 可 以 得 到 基于 半分 信 度 模型 的 克隆 巴赫 
Alpha 值 和 斯 皮尔 曼 -布朗 系数 统计 量 。 半 分 信 度 模型 将 量 表 中 原先 的 7 个 项 拆 分 为 两 个 部 分 :“ 部 
分 1” 含有 “总 是 使 用 ”“ 没 有 其 他 品牌 "”“ 有 电视 广告 ”和 “有 其 他 人 使 用 ”4 个 变量 数据 ;“ 部 
分 2” 含 有 “公司 上 市 ”“ 常 推出 新 产品 ”和 “现任 总 裁 在 职 ”3 个 变量 。 其 中 第 一 部 分 的 克隆 巴 
赫 Alpha 值 为 0.944， 第 二 部 分 的 克隆 巴赫 Alpha 值 为 0.826， 可 见 每 个 部 分 的 内 在 一 致 性 都 非常 
高 。 但 是 两 个 部 分 的 相关 系数 却 只 有 0.503， 可 见 两 部 分 的 相关 性 不 高 。 斯 皮尔 曼 -布朗 系数 和 格 
特 曼 拆 半 系数 都 是 利用 两 个 部 分 的 克隆 巴赫 Alpha 值 计 算得 到 的 ， 本 实验 中 由 于 两 部 分 项 的 数目 
不 一 致 ， 所 以 值 为 0.673 的 “不 等 长 ”系数 更 为 准确 ， 并 且 格 特 曼 拆 半 系 数 仅 为 0.577， 因 此 半分 
信 度 模型 的 结果 显示 内 在 一 致 性 不 是 很 好 。 事 实 上 ， 由 于 半分 信 度 模型 的 结果 因 拆 分 方式 的 不 同 
而 变化 较 大 ， 如 把 相关 性 很 强 的 项 分 在 不 同 部 分 得 到 的 结果 会 更 具有 内 在 一 致 性 ， 因 此 半分 信 度 
模型 的 结果 并 不 是 很 可 靠 ， 一 般 用 重 侧 信 度 模型 。 


17.2 多维 刻度 分 析 


多 维 刻度 分 析 (Multi-dimension Analysis) 又 称 为 多 维 标 度 分 析 ， 是 市 场 研究 的 一 种 有 力 
手段 ， 它 可 以 通过 低 维 空间 (通常 是 二 维 空间 ) 展示 多 个 研究 对 象 〈 比 如 品牌 ) 之 间 的 联系 ， 
利用 平面 距离 来 反映 研究 对 象 之 间 的 相似 程度 。 


17.2.1 ”多维 刻度 分 析 的 原理 


多 维 刻度 分 析 的 主要 思路 是 利用 对 被 访 者 和 对 研究 对 象 的 分 组 ,来 反映 被 访 者 对 研究 对 象 
相似 性 的 感知 , 这 种 方法 具有 一 定 直观 合理 性 。 由 于 多 维 刻 度 分 析 法 通常 是 基于 研究 对 象 之 间 
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的 相似 性 (距离) 的， 只 要 获得 了 两 个 研究 对 象 之 ” 记 吉 志 


间 的 距离 矩阵 , 我 们 就 可 以 通过 相应 统计 软件 做 出 a Ga 
它们 的 相似 性 知觉 图 。 [= 
17.2.2 多 维 刻度 分 析 的 SPSS 操作 Zn 

在 SPSS Statistics 数据 编辑 器 窗口 中 进行 多 维 = 
刻度 分 析 的 操作 步骤 如 下 。 = 

回教 据 为 距 率 他) 

1 在 菜单 栏 中 选择 “分 析 ”|“ 标 度 ” | “多维 [ei zw 
标 度 (ALSCAL) ”命令 ， 打 开 如 图 17-14 所 示 的 。 | 请 生 和 和 
“多 维 标 度 ”对 话 框 。 

2 J js 区 加 区 癌 攻 加 

从 源 变量 列表 框 中 选择 需要 分 析 的 距离 变量 ， 17-14 “多 维 标 度 ” 对 话 杠 
单 击 国 按钮 将 选择 的 变量 选 入 右 侧 的 列表 框 中 。 

“变量 ”列表 杠 


该 列表 框 中 的 变量 数据 是 距离 (不 相似 性 ) 数据 ， 则 所 有 的 不 相似 性 都 应 该 是 定量 的 ， 应 
该 用 相同 的 刻度 进行 度量 , 变量 标 度 之 间 的 差异 可 能 会 影响 解 。 如 果 变量 在 刻度 上 有 很 大 差异 
〈 例 如 : 一 个 变量 以 个 数 为 单位 度量 ， 而 另 一 个 以 时 间 为 单位 度量 )， 那 么 应 该 考虑 对 它们 进 
行 标准 化 〈 这 可 以 通过 多 维 刻度 过 程 来 自动 完成 ) 。 另 外 ， 如 果 数 据 为 距离 ， 则 选择 至 少 4 
个 数值 变量 进行 分 析 。 

“个 别 矩 阵 ” 列 表 框 

该 列表 框 中 的 变量 为 分 组 变量 , 主要 用 于 每 一 类 别 的 分 组 变量 创建 单独 的 矩阵 , 并 且 只 有 
选中 “距离 ”选项 组 中 的 “根据 数据 创建 距离 ” 单 选 按钮 时 ， 该 列表 框 才 会 被 激活 。 


3) 进行 相应 的 设置 。 

“距离 ”设置 

“距离 ”选项 组 主要 用 于 设 定 距离 矩阵 的 形式 或 从 数据 
创建 距离 矩阵 。 

@ 数据 为 距离 。 当 活动 数据 集中 的 数据 本 身 就 是 距离 数 
据 时 , 选中 该 单 选 按钮 。 单 击 “ 形 状 ”按钮 , 将 弹出 如 图 17-15 


所 示 的 “多 维 标 度 : 数据 形状 ”对 话 框 。 图 17-15 “多 维 标 度 : 数据 形状 ” 
在 该 对 话 框 中 可 指定 距离 矩阵 的 形状 。 对 话 框 
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对 称 正方 形 : 表示 活动 数据 集中 的 数据 矩阵 为 正 对 称 和 矩阵 ， 行 和 列表 示 相 同 的 项 目 ， 当 仅 
录入 一 半 的 数据 并 选中 该 单 选 按钮 时 ， 系 统 会 自动 补 全 其 他 数据 。 

不 对 称 正方 形 : 表示 活动 数据 集中 的 数据 矩阵 为 正 不 对 称 矩 阵 , 但 行 和 列表 示 相 同 的 项 目 。 
矩形 : 表示 活动 数据 集中 的 数据 矩阵 为 矩形 ， 并 且 行 和 列表 示 不 同 的 项 目 ， 当 活动 数据 集 
中 的 数据 含有 多 个 矩阵 时 ， 需 要 在 “ 行 数 ”文本 框 中 设置 每 个 矩阵 的 行 数 。 
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@ 根据 数据 创建 距离 。 当 活动 数据 集中 的 数据 本 身 不 是 距离 数据 时 ， 选 中 该 单 选 按钮 。 
单 击 “ 测 量 ”按钮 ， 将 弹出 如 图 17-16 所 示 的 “多 维 标 度 : 根据 数据 中 创建 测量 ”对 话 框 。 

“测量 ”选项 组 用 于 选择 测量 类 型 并 指定 不 相似 的 测量 方法 ， 在 “转换 值 ” 选 项 组 的 “ 标 
准 化 ”下 拉 列 表 框 中 可 选择 数据 标准 化 的 方法 。 

“创建 距离 矩阵 ”选项 组 用 于 选择 需要 要 分 析 的 单位 ， 包 括 两 种 选择 :“ 变 量 间 ” 和 “个 案 间 ”。 

“模型 ”设置 

单 击 “模型 ”按钮 ， 弹 出 如 图 17-17 所 示 的 “多 维 标 度 : 模型 ”对 话 框 。 


瞧 多 给 标 匡 : 根据 数据 g 奎 测量 x 


列 里 
OD) .a 


sw te:， 靶 | 
| 


OitWD: 5a 


0 = 元 @: 而 司 语 | 


17-16 “多 维 标 度 : 根据 数据 创建 测量 ”对 话 框 图 17-17 “多 维 标 度 : 模型 ”对 话 框 

“多 维 标 度 : 模型 ”对 话 框 主要 用 于 设置 数据 的 度 测 置 级 别 、 标 度 模 型 和 维 。 

@ “测量 级 别 ” 选 项 组 。 该 选项 组 用 于 指定 数据 的 测量 级 别 ， 有 3 种 选择 。 

。 有 序 : 表示 数据 为 有 序 标 度 ， 大 部 分 多 维 标 度 分 析 中 的 数据 都 是 此 类 数据 。 其 中 ，“ 解 除 绑 

定 已 绑 定 的 观察 值 ” 复 选 杠 用 于 对 活动 数据 集中 相同 的 评分 赋予 不 同 的 权重 。 

。 区 间 : 表示 数据 为 连续 度量 数据 。 

。 比率 : 表示 数据 为 比率 形式 的 度量 数据 。 

@ “条 件 性 ”选项 组 。 该 选项 组 用 于 指定 哪些 比较 是 有 意义 的 ， 有 3 种 选择 。 

。 矩阵 : 表示 单个 矩阵 内 部 的 数据 可 以 进行 比较 ， 适 用 于 数据 集 只 有 一 个 矩阵 的 情况 或 者 每 

个 矩阵 代表 一 个 测试 者 的 选择 的 情况 。 
。 行 : 表示 只 有 行 数据 之 间 的 比较 是 有 意义 的 ， 该 选项 适用 于 活动 数据 集 为 非 对 称 矩 阵 或 矩 
形 的 情况 。 

。 无 条 件 : 表示 活动 数据 集 任何 数据 之 问 的 比较 是 有 意义 的 ， 该 选项 比较 少 用 。 

@@ “ 维 ” 选 项 组 。 该 选项 组 用 于 设置 标 度 分 析 的 维度 。 在 “最 大 值 ” 和 “最 小 值 ”文本 
框 中 输入 1 一 6 的 整数 ， 系 统 对 该 范围 中 的 每 个 数字 都 计算 出 一 个 答案 。 如 果 在 “最 大 值 ” 和 
“最 小 值 ”中 输入 相等 的 数 ， 则 可 以 获得 单一 的 解 。 

图 “ 标 度 模 型 ”选项 组 。 该 选项 组 用 于 设 定 标 度 度量 模型 ， 有 两 个 选择 。 


。 欧 氏 距离 : 表示 使 用 欧式 距离 模型 ， 适 用 于 任何 形式 的 数据 矩阵 。 
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。 个 体 差异 欧 氏 距离 : 表示 使 用 个 别 差异 的 欧 氏 距离 模型 ， 适 用 于 活动 数据 集中 含有 两 个 或 
两 个 以 上 的 距离 矩阵 。 


蛤 多 维 标 度 : 选项 党 
“选项 ”设置 显示 
单 击 “ 选 项 ”按钮 ， 弹 出 如 图 17-18 所 示 的 “多 维 标 度 : 选 one 
项 ”对 话 框 。 和 84 
“多 维 标 度 : 选项 ”对 话 框 主要 用 于 设 定 显示 的 图 表 和 迭 | | 日 机 a 各 先 顺 摘要 QW) 
代 收 敛 标准 等 。 和 
全 应 力 收 合 : 
中 “显示 ”选项 组 。 该 选项 组 用 于 设 定 输出 的 统计 图 ， 共 最 小 S 应 力 什 (N): 
有 4 种 。 最 大 和 代数 00: 50 ] 
。 组 图 : 输出 多 维 标 度 分 析 图 ， 该 图 用 于 观察 对 象 之 间 的 相 将 小 于 中 : [0 |] 的 距离 视 为 缺失 
似 性 ， 是 多 维 标 度 分 析 中 的 主要 图 表 。 on 
。 个 别 主体 图 : 输出 基于 每 个 测试 者 的 对 象 距离 图 。 
。 数据 矩阵 : 输出 活动 数据 集中 的 数据 矩阵 。 图 17-18 “多 维 标 度 : 选项 ” 
。 模型 和 选项 摘要 : 输出 模型 处 理 的 摘要 等 信息 。 对 话 框 


@ “条 件 ” 选 项 组 。 该 选项 组 用 于 设 定 模 型 迭代 收敛 的 标准 。 

eS 应力 收 敛 : 该 文本 框 用 于 设 定 迭代 中 S 应 力 的 最 小 改变 量 ， 当 模型 迭代 的 S 应 力 的 最 小 
改变 量 小 于 该 值 时 停止 收敛 。 

。 最 小 S 应 力 值 : 该 文本 框 用 于 设 定 最 小 S 应 力 值 ， 当 模型 迭代 的 S 应 力 值 达 到 该 最 小 S 应 
力 值 时 模型 停止 收敛 。 

。 最 大 迭代 次 数 : 该 文本 框 用 于 设 定 模型 最 大 迭代 次 数 , 当 模型 远 代 到 该 设 定 次 数 时 停止 收敛 。 

@“ 将 小 于 [一 J] 的 距离 视 为 缺失 ”文本 框 。 该 文本 框 用 于 对 缺失 值 进行 处 理 ， 当 数据 

集中 小 于 该 值 时 ， 该 数据 就 会 被 视 作 缺失 值 处 理 。 
4) 分 析 结 果 输 出 。 


设置 完毕 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 得 到 多 维 标 度 分 析 的 
结果 。 


17.2.3 ”实验 操作 

下 面 将 以 数据 文件 “17-2” 为 例 ， 讲 解 多 维 刻度 分 析 的 具体 操作 过 程 并 对 结果 进行 说 明 。 

1. 实验 数据 描述 

数据 文件 “17-2” 记 录 了 5 位 测试 者 对 济南 市 四 大 景点 相似 性 的 调研 结果 。 在 该 调研 中 每 
个 测试 者 对 4 个 景点 两 两 之 间 的 相似 性 进行 评分 。 评 分 的 范围 为 1~5， 其 中 1 代表 完全 相似 ， 
2 代表 非常 相似 ，3 代表 一 般 相似 ，4 代表 不 一 般 相似 ，5 代表 极为 不 相似 。 本 调查 共 抽检 了 5 
位 测试 者 。 我 们 将 利用 多 维 刻度 分 析 过 程 ,得 出 4 个 景点 的 相似 和 不 相似 程度 ， 本 数据 文件 的 
原始 Excel 表 如 图 17-19 所 示 。 
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图 17-19 “17-2” 数 据 文件 原始 数据 
首先 在 SPSS 变量 视图 中 建立 变量 “ 受 试 者 ”“item”“ 千 佛山 ”“ 大 明湖 ”“ 购 突 泉 ” 和 “ 植 
物 园 ”， 分 别 用 来 表示 测试 者 的 编号 、 景 点 的 编号 、 各 个 景点 对 比 评分 。 其 中 , “ 受 试 者 ”“item” 
为 名 义 变 量 ，“ 千 佛山 ”“ 大 明湖 ”“ 购 突 泉 ” 和 “植物 园 ” 为 度量 变量 ， 如 图 17-20 所 示 。 


和 信 堆 尺度 分 怕 sav 牙 据 委 1] -IBM SPSS Statistics 效 到 唤 外 名 一 口 x 


JIBM SPSS Stafistics 处 理 程序 统 绪 Unicode ON | T 


图 17-20 “17-2” 数 据 文件 的 变量 视图 


在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ， 输 入 完毕 后 的 部 分 
数据 如 图 17-21 所 示 。 


2. 实验 操作 步骤 
具体 操作 步骤 如 下 : 


GES6i)) 打开 “17-2” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 
析 ”|“ 标 度 ”|“ 多 维 标 度 (ALSCAL) ”命令 ， 打 开 “多 维 标 度 ” 对 话 框 ， 然 后 将 
“和 干 佛山 ”“ 大 明湖 ”“ 县 突 泉 ”和 “植物 园 ” 选 入 “变量 ”列表 框 中 。 
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RR RM sd Siete 有 
教 据 D) ”转换 (D 分析 凶 | 下 清册 本 RiG) 实用 程 斥 WW) 六 因 Q) 窖 QD 帮助 


击 和 者。 品 iem | 依 和 RB 山 | 帮 大 二 衣 ， 信 为 % | 六 者 牧 目 | S 详 量 | 
1 1 4 5 2 
2 4 3 


BM SPSS Statistcs 外 于 图 友 扩 六 | | TUnicode ON 
图 17-21 “17-2” 数 据 文件 的 数据 视图 
ES62 单 击 “选项 ”按钮 ， 打 开 “ 多 维 标 度 : 选项 ”对 话 框 ， 选 中 “组 图 ” 复 选 框 ， 单 击 
“继续 ”按钮 ， 保 存 设置 。 
GES63 单 击 “确定 ”按钮 ， 便 可 以 得 到 多 维 刻度 分 析 结果 。 


3. 实验 结果 及 分 析 


SPSS Statistics 查看 器 窗口 的 输出 结果 如 图 17-22~ 图 17-25 所 示 。 

17-22 给 出 了 多 维 刻度 分 析 模型 的 欠 代 记录 。“Iteration" 列 数字 表示 迭代 次 数 ,“S-stress” 
列 数字 表示 S 应 力 值 ，“Improvement” 列 数字 表示 上 次 迭代 的 S 应 力 值 与 本 次 迭代 的 S 应 力 
值 之 差 ， 由 于 设置 的 S 应 力 最 小 改变 量 为 0.005， 所 以 模型 在 第 八 次 迭代 的 S 应 力 的 最 小 改变 
量 小 于 该 值 时 停止 收敛 。 

17-23 给 出 了 4 个 多 维 刻度 分 析 对 象 的 二 维 得 分 矩阵 。 每 个 对 象 在 各 个 维度 的 得 分 坐标 
提供 了 多 维 刻 度 分 析 图 中 的 坐标 。 


teration history for the 2 dimensional solution (in Squared distances) 


Youngs S-stress formula 1 is used. 


Iteration  S-stress Improvement 


07370 


.04634 .02736 维度 
,03340 .01294 

.02384 .00956 

01633 .00751 

01066 00567 维度 
00668 。 .00399 得 从 


,00406 00261 对 象 名 称 


lterations stopped because 
S-stress is less than .005000 


图 17-22 ”和 迭代 记录 图 17-23 ”对 象 的 二 维 得 分 和 矩阵 


图 17-24 提供 了 欧 氏 距离 模型 线性 拟 合 的 散 点 图 , 该 散 点 图 表示 欧 氏 距离 模型 与 原始 数据 
拟 合 是 否 一 致 。 如 果 所 有 散 点 分 布 在 中 心 线 附近 或 之 上 , 则 表示 欧 氏 距离 模型 与 原始 数据 拟 合 
程度 良好 。 从 该 图 可 以 看 到 ， 所 有 散 点 都 在 中 心 线 附近 ， 因 此 本 实验 的 模型 拟 合 情况 较 好 。 
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图 17-25 给 出 了 多 维 刻度 分 析 图 ， 即 欧 氏 距离 模型 图 。 该 图 在 二 维 坐标 平面 上 将 对 象 或 变 
量 之 间 的 相似 性 和 不 相似 性 通过 距离 远近 的 形式 展现 出 来 ,是 进行 多 维 刻度 分 析 最 重要 的 结果 
图 。 从 该 图 可 以 看 到 ， “植物 园 ” 和 “ 千 佛 山 ” 两 个 景点 在 二 维 图 中 的 距离 最 近 ， 由 此 可 以 判 
断 在 被 调查 者 的 观念 中 “植物 园 ” 和 “ 千 佛 山 ” 两 个 景点 的 相似 性 或 者 关联 性 最 强 。 另 外 ,在 
第 一 维度 上 ， 欧 氏 距 离 将 “大 明湖 ”“ 购 突 泉 ”与 “植物 园 ”“ 千 佛山 ”区 分 开 来 ， 其 原因 在 
于 : “大 明湖 ”“ 购 突 泉 ” 都 属于 水 景 ， 而 “植物 园 ”“ 千 佛山 ”都 属于 植物 类 景观 ， 可 见 第 
一 维度 是 区 分 景观 物理 属性 的 维度 。 


派生 激励 配置 
北 性 拟 合 的 散 点 图 欧 氏 距离 模型 
欧 氏 距离 模型 ‘sd 
8 
. 
训 | 
过 ee 
如 o =” 叫 
aa 
ne 
| sm 
本 
差距 维 1 
图 17-24 ”线性 拟 合 的 散 点 图 图 17-25 多 维 刻度 分 析 图 


17.3 上 机 题 


视频 文件 ，\sample\ 上 机 题 \chap17\.… 


17.1 数据 显示 的 是 某 地 公务 员 考 试 面试 中 三 位 评委 对 面试 者 进行 的 评分 情况 〈 满 分 50 
分 ) ， 试 评价 三 位 评委 的 评分 者 信 度 。 相 关 数 据 如 下 表 所 示 〈 数 据 路 径 : 视频 文件 sample\ 上 
机 题 \chap17\ 习 题 \ 第 17 章 第 一 题 .sav) 。 


A 评委 C 评 委 
35.00 25.00 
40.00 30.00 
37.00 28.00 
30.00 24.00 
38.00 31.00 
42.00 32.00 
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(1) 试 计算 项 间 的 相关 性 和 矩阵 及 每 个 项 之 间 的 相关 系数 。 
(2) 试 计算 克隆 巴赫 Alpha 值 ， 判 断 评委 们 的 评分 稳定 性 。 


17.2 ”为 保证 语文 阅卷 的 公平 性 ， 抽 取 了 200 名 学 生 的 作文 进行 复评 ， 初 评 复评 各 等 级 
的 试卷 数 量 如 数据 文件 所 示 。 试 利用 kappa 系数 判断 两 次 评 卷 的 一 致 性 情况 。 
该 初评 和 复评 得 分 组 合 情 况 的 例 数 ， 即 权重 。 相 关 数 据 如 下 表 所 示 〈 数 据 路 径 : 视频 文件 
\sample\ 上 机 题 \vhap17\ 习 题 \ 第 17 章 第 二 题 .sav) 。 


“ 权 数 ”表示 
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初评 得 分 权 数 
0.00 78.00 
0.00 5.00 
0.00 0.00 
1.00 6.00 
1.00 56.00 
1.00 13.00 
2.00 0.00 
2.00 10.00 
2.00 32.00 


试 利用 信 度 分 析 计 算 Kappa 系数 ， 判 断 两 次 评 卷 的 一 致 性 。 


第 18 章 ”缺失 值 分 析 


缺失 值 可 能 会 导致 严重 的 问题 。 如 果 带 有 缺失 值 的 个 案 与 不 带 缺 失 值 的 个 案 有 着 根本 的 不 
同 ， 则 结果 将 被 误导 。 此 外 ,缺失 的 数据 还 可 能 降低 所 计算 的 统计 量 的 精度 ， 因 为 计算 时 的 信 
息 比 原 计划 的 信息 要 少 。 另 一 个 问题 是 , 很 多 统计 过 程 背 后 的 假设 都 基于 完整 的 个 案 , 而 缺失 
值 可 能 使 所 需 的 理论 复杂 化 。 本 章 将 主要 对 缺失 值 分 析 过 程 进行 详细 介绍 。 


18.1 缺失 值 分 析 简 介 


众所周知 ,在 诸如 收入 、 交 通 事 故 等 问题 的 研究 中 ， 因 为 被 调查 者 拒绝 回答 或 者 由 于 调查 
研究 中 的 损耗 ， 会 存在 一 些 未 回答 的 问题 。 例 如 在 一 次 人 口 调查 中 ，15% 的 人 没有 回答 收入 情 
况 , 高 收入 者 的 回答 率 比 中 等 收入 者 要 低 , 或 者 在 严重 交通 事故 报告 中 , 诸如 是 否 使 用 安全 带 
和 酒精 浓度 等 关键 问题 在 很 多 个 案 中 都 没有 记录 ， 这 些 缺 失 的 个 案值 便 是 缺失 值 。 


18.1.1 缺失 值 的 表现 形式 


缺失 值 主要 表现 为 以 下 3 种 : 


(1) 完全 随机 缺失 (Missing Completely At Random，MCAR) ， 表 示 缺 失 和 变量 的 取 值 
无 关 。 例 如 ， 假 设 在 研究 年 龄 和 收入 的 关系 ,如 果 缺 失 的 数据 和 年 龄 或 收入 数值 无 关 ， 则 缺失 
值 方式 为 MCAR。 要 评估 MCAR 是 否 为 站 得 住 脚 的 假设 , 可 以 通过 比较 回答 者 和 未 回答 者 的 
分 布 来 评估 观察 数据 。 也 可 以 使 用 单 变量 t+ 检验 或 Littles MCAR 多 变量 检验 来 进行 更 正规 的 
评估 。 如 果 MCAR 假设 为 真 ， 可 以 使 用 列表 删除 〈listwise deletion) 《完整 个案 分 析 ) ， 无 
须 担 心 估计 偏差 ， 尽 管 可 能 会 丧失 一 些 有 效 性 。 如 果 MCAR 不 成 立 ， 列 表 删 除 、 均 值 置 换 等 
允 近 方法 就 可 能 不 是 好 的 选择 。 

(2) 随机 缺失 (Missing At Random，MAR) ， 缺 失 分布 中 调查 变量 只 依赖 于 数据 组 中 有 
记录 的 变量 。 继 续 上 面 的 例子 ， 考 虑 年 龄 全 部 被 观察 ， 而 收入 有 时 有 缺失， 如 果 收 入 缺失 值 仅 
依赖 于 年 龄 ， 缺 失 值 就 为 MAR。 

(3) 非 随机 缺失 。 这 是 研究 者 最 不 愿意 看 到 的 情形 ， 数 据 的 缺失 不 仅 和 其 他 变量 的 取 值 
有 关 ， 也 和 自身 有 关 。 如 果 收 入 缺失 值 依赖 于 收入 值 ， 则 既 不 是 MCAR， 也 不 是 MAR。 


18.1.2 ”SPSS 中 对 缺失 值 的 处 理 


SPSS 主要 对 MCAR 和 MAR 两 种 缺失 值 情况 进行 分 析 。 区 别 MCAR 和 MAR 的 含义 在 
于 : 由 于 MCAR 实际 上 很 难 遇 到 ， 应 该 在 进行 调查 之 前 就 考虑 哪些 重要 变量 可 能 会 有 非 无 效 
的 未 回答 ， 还 要 尽量 在 调查 中 包括 共 变量 ， 以 便 用 这 些 变量 来 估算 缺失 值 。 

针对 不 同情 况 的 缺失 值 ，SPSS 操作 给 出 了 以 下 3 种 处 理 方法 : 
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(1) 删除 缺失 值 ， 这 种 方法 适用 于 缺失 值 非常 少 的 时 候 ， 它 不 需要 专门 的 步骤 ， 通 常 在 
相应 的 分 析 对 话 框 的 “选项 ” 子 对 话 框 中 进行 设置 。 
(2) 替换 缺失 值 ， 利 用 “转换 ”菜单 中 的 “替换 缺失 值 ”命令 将 所 有 的 记录 看 成 一 个 序 


列 ， 然 后 采用 某 种 指标 对 缺失 值 进 行 填充 。 


(3) 缺失 值 分 析 过 程 ， 缺 失 值 分 析 过 程 是 SPSS 专门 针对 缺失 值 分 析 而 提供 的 模块 。 


18.2 SPSS 的 缺失 值 分 析 过 程 


缺失 值 分 析 过 程 有 以 下 3 个 主要 功能 : 


(1) 描述 缺失 值 的 模式 。 通 过 缺失 值 分 析 的 诊断 报告 ， 用 户 可 以 明确 地 知道 缺失 值 所 在 


位 置 及 其 出 现 的 比例 是 多 少 ， 还 可 以 推断 缺失 值 是 否 为 随机 缺失 等 。 


(2) 利用 列表 法 、 成 对 法 、 回 归 法 或 EM (期 望 最 大 化 ) 法 等 为 含 缺失 值 的 数据 估算 平 


均值 、 标 准 误差 、 协 方差 和 相关 性 ， 成 对 法 还 可 显示 成 对 完整 个 案 的 计数 。 


(3) 使 用 回归 法 或 EM 法 用 估算 值 填 充 〈 插 补 ) 缺失 值 ， 以 此 提高 统计 结果 的 可 信 度 。 


缺失 数据 可 以 是 分 类 数据 或 定量 数据 〈 刻 度 或 连续 ) ， 尽 管 如 此 ，SPSS 只 能 为 定量 变量 
估计 统计 数据 并 插 补 缺失 数据 。 对 于 每 个 变量 , 必须 将 未 编码 为 系统 缺失 值 的 缺失 值 定义 为 用 


户 缺失 值 。 


18.2.1 在 SPSS 中 实现 缺失 值 分 析 


下 面 就 对 如 何 利用 SPSS 系统 实现 缺失 值 分 析 
的 操作 过 程 进行 详细 说 明 ， 步 骤 如 下 。 

1) 在 菜单 栏 中 选择 “分 析 ”|“ 缺 失 值 分 析 ” 
命令 , 打开 如 图 18-1 所 示 的 “缺失 值 分 析 ” 对 话 框 。 

2) 进行 相应 的 设置 。 


Q@ “定量 变量 ”列表 框 。 用 以 选 入 进行 缺失 
值 分 析 的 定量 变量 。 

@@ “分 类 变量 ”列表 框 。 用 以 选 入 进行 缺失 
值 分 析 的 分 类 变量 , 选 入 分 类 变量 后 , 还 可 以 在 “最 
大 类 别 数 ” 文 本 框 中 设 定 分 类 变量 允许 的 最 大 分 类 
数 ， 超 过 此 临界 值 的 分 类 变量 将 不 进入 分 析 ， 默 认 
值 为 25。 
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图 18-1 “ 缺 


@@ “个 案 标签 ”列表 框 。 用 于 选 入 标签 变量 以 便 对 结果 进行 标识 。 


由 “使 用 所 有 变量 ”按钮 。 单 击 该 按钮 ， 可 以 自动 将 左 侧 源 变量 列表 框 中 的 所 有 变量 选 
入 特定 的 分 析 列 表 框 中 ， 数 值 型 变量 全 部 选 入 “定量 变量 ”列表 框 ， 字 符 型 等 分 类 变量 全 部 选 


入 “分 类 变量 ”列表 框 。 


@ “模式 ”按钮 。 单 击 该 按钮 ， 弹 出 如 图 18-2 所 示 的 “缺失 值 分 析 : 模式 ”对 话 框 ， 该 


对 话 框 用 于 设置 显示 输出 表格 中 的 缺失 数据 模式 和 范围 。 
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图 18-2 “缺失 值 分 析 : 模式 ”对 话 框 
e “显示 ”选项 组 用 于 选择 缺失 值 样式 表 的 类 型 ， 包 括 3 个 复 选 框 ， 其 含义 如 表 18-1 所 示 。 
表 18-1 “显示 ”选项 组 内 容 介 绍 


内 容 含义 
选中 该 复 选 框 ， 则 表示 为 每 个 分 析 变 量 都 输出 缺失 值 样式 表 ， 以 每 种 模式 中 显示 
se 的 频率 被 制 成 表格 。 若 选中 “ 按 缺 失 值 模式 将 变量 排序 ” 复 选 框 ， 则 表示 对 变量 
按 模 式 相 似 性 排序 
具有 缺失 值 的 个 案 ( 按 | 选中 该 复 选 框 , 则 表示 针对 每 个 分 析 变 量 将 每 一 个 带 有 缺失 值 或 极 值 的 个 案 制 表 。 
缺失 值 模式 排序 ) 若 选 中 “ 按 缺 失 值 模式 将 变量 排序 ” 复 选 框 ， 则 表示 对 变量 按 模式 相似 性 排序 
所 有 个 案 ( 可 以 选择 按 | 选中 该 复 选 框 , 则 表示 对 每 个 个 案 进行 制 表 且 每 个 变量 都 被 表示 为 缺失 值 和 极 值 。 
选 定 变量 排序 ) 如 果 没 指定 变量 排序 依据 ， 个 案 将 按 其 在 数据 文件 中 出 现 的 顺序 列 出 


。 “变量 ”选项 组 用 于 设置 显示 分 析 中 所 含 变量 的 附加 信息 。 其 中 ， “以 下 对 象 的 缺失 模式 ” 
列表 框 用 以 显示 所 有 选 入 的 分 析 变 量 ; “以 下 对 象 的 附加 信息 ”列表 框 ， 用 于 从 左 侧 列表 
框 中 选 入 要 输出 附加 信息 的 变量 ， 在 样式 表 中 ， 对 于 定量 变量 ， 将 输出 其 均值 ， 对 于 分 类 
变量 ， 将 显示 在 每 个 类 别 中 具有 模式 的 个 案 数 量 。 
。 只 有 当选 中 “显示 ”选项 组 的 “所 有 个 案 ( 可 以 选择 按 选 定 变量 排序 ) ” 复 选 框 时 “排序 
依据 ” 才 可 使 用 ， 其 用 于 设 定 输出 观测 列表 的 排序 变量 。 在 “排列 顺序 ”选项 组 中 通过 选 
中 “升序 ”或 “降序 ” 单 选 按钮 可 使 得 个 案 按照 指定 变量 值 的 升序 或 降序 列 出 。 
在 显示 个 别 个 案 的 表格 中 ， 最 大 值 和 最 小 值 用 “+” 和 “-” 符 号 标识 ， 系 统 缺 失 值 用 S 
表示 ， 用 户 缺 失 值 的 第 一 、 第 二 、 第 三 种 类 型 分 别 用 A、B 和 C 字母 表示 。 
@ “描述 ”按钮 。 单 击 该 按钮 ， 将 弹出 如 图 18-3 所 示 的 “缺失 值 分 析 : 描述 ”对 话 框 ， 
在 此 设置 要 显示 的 缺失 值 描述 统计 变量 。 
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“ 单 变量 统计 ” 复 选 框 :选中 该 复 选 框 ， 将 

输出 每 个 变量 的 非 缺 失 值 的 数量 及 缺失 值 的 

数量 和 百分比 ， 对 于 定量 ( 尺度 ) 变量 ， 还 

将 显示 平均 值 、 标 准 误差 及 最 大 值 和 最 小 什 

的 数量 。 

“指示 符 变量 统计 ”选项 组 : 对 于 每 个 进入 

分 析 的 变量 ，SPSS 自动 创建 一 个 指示 变量 ， eat 

用 以 指示 单个 个 案 的 变量 存在 或 缺失 , 包括 3 。 | | SS 人) % 介 

个 复 选 框 。 

> 不 匹配 百分比 : 选中 该 复 选 框 ， 表 示 对 于 las) na mm 
每 对 变量 , 显示 其 中 一 个 变量 具有 缺失 值 ， 。 图 18-3 “缺失 值 分 析 ， 描述 ”对 话 框 
另 一 个 变量 具有 非 缺 失 值 的 个 案 数 百 分 
比 。 表 中 的 每 个 对 角 元 素 都 包含 单个 变量 具有 缺失 值 的 百分比 。 若 选中 “ 按 缺 失 值 模 
式 排序 ” 复 选 框 ， 则 表示 按 缺 失 值 模式 进行 排序 。 

> 使 用 由 指示 符 变量 构成 的 组 执行 + 检验 : 若 选 中 该 复 选 框 ， 则 表示 使 用 学 生 t 统 计量 ， 比 
较 每 个 定量 变量 的 两 个 组 的 均值 该 组 指定 一 个 变量 存在 或 缺失 ， 显 示 两 个 组 的 + 统计 
量 、 自 由 度 、 缺 失 和 非 缺 失 值 计数 及 平均 值 。 通 过 选中 “在 表 中 包括 概率 ” 复 选 框 ， 还 
可 以 在 输出 结果 中 显示 任何 与 t 统计 量 相关 的 双 尾 概率 。 如 果 分 析 所 产生 的 检验 超过 一 
个 ， 则 不 得 将 这 些 概率 用 于 显著 性 检验 ; 只 有 当 计算 单个 检验 时 ， 此 概率 才 适 合 。 

> 生成 分 类 变量 和 指示 符 变量 的 交叉 表 : 选中 该 复 选 框 ， 表 示 为 每 个 分 类 变量 显示 一 个 
表 ， 对 于 每 个 类 别 ， 该 表 显 示 其 他 变量 具有 非 缺 失 值 的 频率 和 百分比 ， 同 时 显示 每 种 
类 型 缺失 值 的 百分比 。 通 过 输入 不 同 的 值 ， 可 以 使 用 “省 略 缺 失 值 占 个 案 数 的 比例 小 
于 n 个 案 数 的 % 的 变量 ”选项 以 删除 缺失 值 出 现 次 数 较 小 的 变量 的 统计 量 。 


@ “估算 ”选项 组 。 该 选项 组 用 于 选择 处 理 缺 失 值 的 方法 ， 以 估算 平均 值 、 标 准 误差 、 
协 方差 和 相关 性 等 统计 量 。 


成 列 : 表示 仅 使 用 完整 个 上 案 ， 若 选中 该 复 选 框 ， 一 旦 任何 分 析 变 量具 有 缺失 值 ， 则 在 计算 
中 将 忽略 该 个 案 。 

成 对 : 选中 该 复 选 框 ， 表 示 只 有 当 分 析 变 量 对 两 者 都 具有 非 缺 失 值 时 才 使 用 个 案 。 频 率 、 
平均 值 及 标准 误差 是 针对 每 对 分 别 计算 的 。 由 于 忽略 个 案 中 的 其 他 缺失 值 ， 两 个 变量 的 相 
关 性 与 协 方差 不 取决 于 任何 其 他 变量 的 缺失 值 。 

EM: 选中 该 复 选 框 ， 表 示 用 EM 和 迭代 方法 估计 缺失 值 ， 每 个 迭代 都 包括 一 个 了 步骤 和 一 
个 M 步骤 。 在 给 定 观察 值 和 当前 参数 估算 值 的 前 提 下 ，E 步骤 查找 “缺失 ”数据 的 条 件 
期 望 值 ， 这 些 期 望 值 将 替换 “缺失 ”数据 。 在 M 步骤 中 ， 即 使 填写 了 缺失 数据 ， 也 将 计 
算 参 数 的 最 大 似 然 估计 值 。 

回归 : 选中 该 复 选 框 ， 表 示 使 用 多 元 线性 回归 算法 估算 缺失 值 。 此 方法 计算 多 个 线性 回归 
估算 值 并 具有 用 于 通过 随机 元 素 增加 估算 值 的 选项 。 对 于 每 个 预测 值 ， 其 过 程 可 以 从 一 个 
随机 选择 的 完整 个 案 中 添加 一 个 残 差 , 或 者 从 分 布 中 添加 一 个 随机 正 态 偏差 、 一 个 随机 
偏差 (通过 残 差 均值 方 的 平方 根 测量 ) 来 完成 。 
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单 击 “ 估 算 ” 选 项 组 中 的 “EM” 按钮 ， 弹 出 如 图 到 E 间 
18-4 所 示 的 “缺失 值 分 析 : EM” 对 话 框 ， 在 该 对 话 框 | 
中 可 以 设置 EM 算法 的 相关 参数 : [下 坟 加 


日 “分 布 ”选项 组 : 用 于 设置 总 体 的 分 布 形式 ， 默 ee 
认 情况 下 ， 选 中 “ 正 态 ” 单 选 按钮 ， 即 默认 总 | | oss 中 
体 服 从 正 态 分 布 。 若 选中 “学 生 ” 单 选 按钮 ， 并 
在 “自由 度 ” 文 本 框 中 输入 响应 自由 度 ， 则 表示 
假设 总 体 服从 自由 度 为 n 的 分布 ， 若 选中 “ 混 
合 正 态 ” 单 选 按钮 ， 需 在 “混合 比例 ”及 “标准 
差 比率 ”文本 框 中 输入 相应 的 数值 ， 指 定 两 个 分 
布 的 混合 正 态 分 布 与 混合 比例 的 标准 差 比率 。 

。 “最 大 迭代 次 数 ”文本 框 : 用 以 指定 EM 法 的 最 
大 迭代 次 数 ， 默 认 值 为 25。 图 18-4 “缺失 值 分 析 : EM” 对 话 框 

e “保存 完成 的 数据 ” 复 选 框 : 用 于 保存 将 缺失 值 用 
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起 议 全 分析; 回 昌 x 
EM 算法 蔡 换 后 的 数据 ， 若 选中 “创建 新 数据 集 ” | gs 
单 选 按钮 ， 则 可 以 新 建 一 个 数据 集 ， 在 “数据 集 名 sg 
称 ” 文 本 框 中 输入 数据 集 名 称 ; 若 选中 “ 写 入 新 数 


口 学 生 t 交 量 (8) 
据 文 件 ” 单 选 按钮 ， 则 可 以 新 建 一 个 数据 文件 ， 单 er 
击 “ 文 件 ” 按 钮 指定 文件 路 径 和 文件 名 称 。 
单 击 “ 回 归 ” 按 钮 ， 弹 出 如 图 18-5 所 示 的 “缺失 
值 分 析 : 回归 ”对 话 框 ， 在 该 对 话 框 中 可 设置 回归 算 
法 的 参数 。 


。 “估算 调整 ”选项 组 : 回归 方法 可 为 回归 估算 添 
加 随机 分 量 。 可 以 选择 的 随机 分 量 有 残 差 、 普 通 


©x(0) 


变量 、 学 生 t 变量 或 无 ， 如 表 18-2 所 示 。 网 人 人 因 时 省 全 本 
表 18-2 “估算 调整 ”选项 组 内 容 介绍 


估计 调节 选项 
残 差 


含义 
选中 该 单 选 按钮 ,表示 从 要 添加 到 回归 估算 的 完整 个 案 观察 到 的 残 差 中 ,随机 选择 误差 项 
选中 该 单 选 按钮 ， 表 示 从 期 望 值 为 0 且 标 准 差 等 于 回归 的 均 方 误差 项 平方 根 的 分 布 中 ， 
随机 抽取 误差 项 

学 生 t 变 量 | 选中 该 单 选 按钮 ， 表 示 从 t(n) 分 布 中 随机 抽取 误差 项 ， 并 按 根 均 方 误差 标 度 误差 项 


无 选中 该 单 选 按钮 ， 表 示 不 添加 随机 误差 项 

。 “最 大 预测 变量 数 ” 复 选 框 : 用 于 指定 能 进入 回归 方程 的 自 变 量 的 最 大 个 数 。 

。 “保存 完成 的 数据 ” 复 选 框 : 与 “缺失 值 分 析 : EM” 对 话 框 中 类 似 。 

在 “缺失 值 分 析 ” 对 话 框 中 选中 “EM” 和 “回归 ” 复 选 框 后 ， 单 击 “ 变 量 ”按钮 ， 弹 出 
如 图 18-6 所 示 的 “缺失 值 分 析 : EM 的 变量 以 及 回归 ”对 话 框 。 


普通 变量 
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图 18-6 “缺失 值 分 析 : EM 的 变量 以 及 回归 ”对 话 框 


在 该 对 话 框 中 选择 指定 变量 的 方式 ， 有 两 种 : “使 用 所 有 定量 变量 ”， 表 示 使 用 所 有 定量 
变量 ， “选择 变量 ”， 表 示 由 用 户 自行 设置 分 析 变 量 。 


。 “定量 变量 ”列表 框 : 该 列表 框 用 于 显示 所 有 可 用 于 缺失 值 分 析 的 定量 变量 。 

。 “预测 变量 ”列表 框 : 包括 两 个 列表 框 ， 上 半 部 分 的 “预测 变量 ”列表 框 中 用 于 选 入 需要 
估算 缺失 值 的 因 变 量 , 下 半 部 分 的 “预测 变量 ”列表 框 中 用 于 选 入 需要 估算 缺失 值 的 自 变 量 。 

。 “两 者 ”按钮 : 单 击 该 按钮 ,可 以 把 “定量 变量 ”列表 框 中 选中 的 变量 , 同时 选 入 两 个 “ 预 
测 变量 ”列表 框 中 。 

3) 输出 分 析 结 果 。 

设置 完毕 后 ， 单 击 “ 缺 失 值 分 析 ” 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 

器 窗口 得 到 缺失 值 分 析 的 结果 。 


18.2.2 ”实验 操作 


下 面 将 以 “18-1” 数 据 文件 为 例 , 讲解 缺失 值 分 析 的 具体 操作 过 程 并 对 输出 结果 进行 说 明 。 
1. 实验 数据 描述 


“18-1” 数 据 文 件 来 源 于 SPSS 24.0 自 带 的 数据 文件 “telco_missing.sav”。 该 数据 文件 是 
“telco.sav” 数 据 文件 的 子 集 ， 但 某 些 人 口 统计 数据 值 已 被 缺失 值 蔡 换 。 该 假设 数据 文件 涉及 
某 电 信 公 司 在 减少 客户 群 中 的 客户 流失 方面 的 举措 , 每 个 个 案 对 应 一 个 单独 的 客户 , 并 记录 各 
类 人 口 统计 和 服务 用 途 信息 。 下 面 将 结合 本 数据 文件 详细 说 明 如 何 得 到 “18-1” 数 据 文件 的 缺 
失 值 ， 从 而 认识 SPSS 的 缺失 值 分 析 过 程 。 

打开 “18-1” 数 据 文 件 ， 在 SPSS Statistics 数据 编辑 器 窗口 中 可 以 看 到 “18-1” 数 据 文件 
的 变量 描述 ， 如 图 18-7 所 示 。 
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18-7 “18-1” 数 据 文件 的 变量 描述 


2. 实验 操作 步骤 
GE56) 打开 “18-1” 数 据 文 件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 


析 ”| “缺失 值 分 析 ” 命 令 ， 
选择 “婚姻 状况 fmarital]”“ 受 教育 水 平 [ed]”“ 退 休 retirel” 及 “性 别 [genderl”4 个 
变量 进入 “分 类 变量 ”列表 框 ， 选择 “服务 月 数 [lenure]”“ 年 龄 age]”“ 在 现 住址 居 


[Step 


打开 “缺失 值 分 析 ” 对 话 框 。 


住 年 数 [address]”“ 家 庭 收 入 ( 千 ) [income]”“ 现 职位 工作 年 数 [employ]” 及 “家 庭 
人 数 [reside]”6 个 变量 进入 “定量 变量 ”列表 框 ， 如 图 18-8 所 示 。 


EE 


在 “缺失 值 分 析 ” 对 话 框 中 单 击 “ 模 式 ” 按 钮 ， 弹 出 “缺失 值 分 析 : 模式 ”对 话 框 ， 


选中 “显示 ”选项 组 中 的 “个 案 表 ( 按 缺失 值 模式 分 组 )” 复 选 框 ， 从 “以 下 对 象 的 
缺失 模式 ”列表 框 中 选中 income、ed、retire 和 gender 4 个 变量 进入 “以 下 对 象 的 附 


加 信息 ”列表 框 中 。 其 他 采用 默认 设置 ， 如 图 18-9 所 示 。 设 置 完毕 后 ， 单 击 “ 继 续 ” 
按钮 ， 回 到 “缺失 值 分 析 ” 对 话 框 。 
屿 所 具 值 分 析 再 i 
定量 次 便 (Q): 时 示 
吻 免责 电话 服务 foll- 1 于 个 误 表 ( 控 也 失信 模式 分 组 ) GD) 
rio 四 2 于 人 CF) 
届 天线 服 务 wirelesal 从 现职 位 工作 年 数 
2 Far 
分 类 有 量 (C): 
2 HAF 蜗 婚 姐 杖 咒 imartal] 
上 月 无线 Iwiremon]| 晤 受 禾 育 水 下 ledl 
入 2 mumna 国 [| | vee 
全 语音 gf voice] 
喝 弛 服务 pager| 
曲 ERJIntemedl 县 大 闪 9 坝 0: [25 |] 
磺 末 电 旦 示 [calid] 个 来 村 从 
stdind | i 
ET 
[jie gE®) ma -am 
18-8 “缺失 值 分 析 ” 对 话 框 图 18-9 “缺失 值 分 析 : 模式 ”对 话 框 
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EGG 单 击 “描述 " 按钮， 弹出 “缺失 值 分 析 
描述 ”对 话 框 。 选中“ 单 变量 统计 ” 复 | 
选 框 及 “指示 符 变量 统计 ”选项 组 中 的 。 | erga 
“使 用 由 指示 符 变量 构成 的 组 执行 检 。 | | me 


国 找 套 涉 值 性 式 排 床 (5) 


验 ” 和 “生成 分 类 变量 和 指示 符 变 量 的 网 使 用 由 指示 生变 量 构成 的 组 执行 检验 

交叉 表 ” 复 选 框 ， 其 他 采用 默认 设置 ， 人 

ee ns ee 省 罗 抽 失信 占 个 案 才 的 比例 小 于 (Q) 5。 ] % 的 衬 
GES365 “缺失 值 分 析 : EM” 对 话 框 中 的 参数 采 

用 默认 设置 即 可 。 [EE EE 
3. 实验 结果 及 分 析 图 18-10 “缺失 值 分 析 : 描述 统计 ”对 话 框 


设置 完毕 后 ， 单 击 “ 缺 失 值 分 析 ” 对 话 框 中 的 “确定 ”按钮 ， 就 可 以 在 SPSS Statistics 查 
看 器 窗口 得 到 缺失 值 分 析 的 结果 ， 如 图 18-11~ 图 18-19 所 示 。 

图 18-11 所 示 的 “ 单 变量 统计 ” 表 给 出 了 所 有 分 析 变 量 未 缺失 数据 的 频数 、 平 均值 和 标准 
差 , 同时 给 出 了 缺失 值 的 个 数 和 百分比 以 及 极 值 的 统计 信息 。 通 过 这 些 信息 , 我 们 可 以 初步 了 
解数 据 的 概貌 特征 ， 以 employ 一 栏 为 例 ，employ 变量 的 有 效 数据 有 904 个 ， 它 们 的 平均 值 为 
11， 标 准 差 为 10.113， 缺 失 数 据 有 96 个 ， 占 数据 总 数 的 比例 为 9.6%， 有 15 个 极 大 值 。 


单 变量 统计 
缺 多 极 值 数 ” 
个 案 数 平均 什 标准 兰 计数 百分比 低 遍 
tnure 968 35.56 21.268 32 3.2 0 0 
age 975 41.75 12.573 25 25 0 0 
address 850 11.47 9.965 150 15.0 0 9 
income 821 71.1462 83.14424 179 179 0 71 
employ 904 11.00 10.113 96 96 0 15 
reside 966 2.32 1.431 34 3.4 0 33 
marital 885 115 115 
ed 965 35 3.5 
retire 916 84 8.4 
gender 958 42 42 


a. 超出 范围 (Q1 - 1.5*IQR, Q3 + 1.5*IQR) 的 个 案 数 。 
图 18-11 单 变 量 统计 表 


图 18-12 和 图 18-13 为 使 用 EM 法 进行 缺失 值 的 估算 后 , 总 体 数据 的 均值 和 标准 差 的 变化 情 
况 ， 其 中 “所 有 值 ”为 原始 数据 的 统计 特征 ，EM 为 使 用 EM 法 后 总 体 数据 的 统计 特征 。 


估算 的 平均 值 摘要 


所 有 值 35.56 41.75 11.47 | 71.1462 11.00 2.32 
EM 36.12 41.91 11.58 | 77.3941 11.22 2.29 


图 18-12 ”估算 的 平均 值 摘要 
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估算 标准 差 摘 要 
mm 另 全 个 下 
8 号 二 训 
s 怠 Es § 2 


所 有 值 ” 21.268 12573 9.965 83.14424 10.113 1.431 
EM 21.468 12.699 10.265 87.54860 10.165 1.416 


18-13 ”估算 标准 差 摘要 


18-14 给 出 了 独立 方差 t 测 试 结果 ， 用户 可 以 从 中 找 出 影响 其 他 定量 变量 的 变量 的 缺失 
值 模式 , 即 通过 单个 方差 t 统 计量 结果 检验 缺失 值 是 否 为 完全 随机 缺失 。 由 图 18-14 可 以 看 出 ， 
年 龄 大 的 人 倾向 于 不 报告 收入 水 平 ， 当 收入 值 缺失 时 ，age 的 均值 是 49.73， 当 收入 值 完整 时 ， 
age 的 均值 为 40.01。 通 过 income 一 栏 的 t 统 计量 可 以 看 出 ，income 的 缺失 将 明显 影响 其 他 定 
量变 量 ， 这 就 说 明 income 的 缺失 不 是 完全 随机 人 缺失。 

图 18-15 以 marital 为 例 给 出 了 分 类 变量 与 其 他 定量 变量 间 的 交叉 表 。 该 表 给 出 了 在 不 同 
婚姻 情况 下 ， 各 分 类 变量 非 缺 失 的 个 数 和 百分比 ， 以 及 各 种 缺失 值 的 个 数 和 百分比 ， 图 中 标识 
了 系统 缺失 值 的 取 值 ， 以 及 各 变量 在 不 同 婚姻 情况 中 的 分 布 情况 。 


独立 方差 t 检 验 ” 
1 里 3 s 
3 兰 5 

= 4 3 35 14 10 

自 册 度 2022 1925 3136 1911 1995 

四 让 下 到 819 937 850 693 766 824 
刷 读 失 数 149 143 0 126 138 142 
WERE 3568 4179 1147 74.0779 1120 234 

和 约 值 【 抽 夫 》 3491 41.49 552734 9.86 221 

1 -50 -83 -39 -59 36 

向 出 度 2495 2228 1911 2033 3152 

上 布下 数 793 801 693 821 741 792 
总 。 谈天 数 175 174 157 0 163 174 
寿 沟 全 ( 邦 在 》 3393 4001 1067 711462 991 239 

覃 网 信 (所 夫 》 4297 4973 1497 15.93 202 

1 -10 -4 -7 5 -3 

在 出 度 1105 1102 97.6 114.9 1109 

总 。 布 在 业 977 881 766 744 904 874 
三 扇 夫 数 加 4 4 0 0 92 
FREE 3534 4169 1137 714953 11.00 231 

和 均值 【 铅 夫 》 37.70 4227 1232 67.9125 237 

t 0 18 12 -8 9 22 

自由 度 1481 1495 1388 121 1283 1342 
夏布 在 数 856 862 748 728 805 857 
i 抽 夫 区 112 113 10 93 99 109 
和 多 值 (存在 ) 3556 4200 1161 703887 1110 228 

在 均值 ( 姥 夫 》 35.57 3985 1043 77.0753 10.17 261 

t 6 -4 4 3 2 

自由 度 954 944 840 932 99.0 

号 。_ 丰 在 数 888 893 777 751 3904 885 
站 。 献 失 数 80 82 73 70 0 81 
在 均值 (存在 ) 3544 4170 1142 713356 11.00 232 

下 均值 扫 失 ) 3689 4229 1196 691143 230 


对 于 每 个 定 生变 盘 ， 由 指示 逢 交合 构成 组 对 《存在 与 缺 夫 ) 。 
了 不 会 显示 款 失 百分比 低 于 5% 的 指示 稚 变 重 。 


18-14 ”独立 方差 + 检验 输出 结果 
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marital 

号 和 失 

系 

统 

误 

3 失 

+ 拆 3 值 
address ”而 在 。 计数 850 390 358 102 
百分比 850 855 834 887 
缺 天。 系统 负 夫 值 分 比 15.0 145 156 113 
income 。 存在 。 计数 B21 380 348 加 
百分比 821 833 a11 B09 
读 天 ”过 入 汪 天 从 刘 泥 ” 。 179 167 189 191 
employ 存在 计数 304 418 387 加 
百分比 904 97 902 861 
缺失 。 系统 铝 突 全 百分比- 96 83 98 139 
reure 存在 计数 316 423 392 101 
百分比 916 928 94 678 
后 失 。 系 钳 峰值 百分比 84 72 86 122 


不 会 是 示 缺 失 百 分 比 低 对 5% 的 指示 符 变 量 。 
18-15 ”分 类 变量 和 定量 变量 交叉 表 
图 18-16 给 出 了 表格 模式 输出 结果 (缺失 值 样式 表 ) ， 它 给 出 了 缺失 值 分 布 的 详细 信息 ， 
X 为 使 用 该 模式 下 缺失 的 变量 。 由 图 可 以 看 出 ， 所 有 显示 的 950 个 个 案 中 ，9 个 变量 值 都 完整 


的 个 案 数 有 475 个 ， 缺 失 income 值 的 个 案 有 109 个 ， 同 时 缺失 address 和 income 值 的 个 案 有 
16 个 ， 其 他 数据 的 解释 类 似 。 


制 表 模式 
MA ye 
提 § 昌 3 及 8 s § 1 : . 
ee 2 | 到 § E 各 兰 
1 1 

本 
ms 1 
09 x se | wl w|i wl 
四 x x S87 5 9 o 1 1 
加 x S62 S438 27 9 6 
3 x ea 560000 4 3 2 3 1 
0 x 535 772157 1 2| ai 芭 5 
加 x 4 478125 o 0 0 0 0 
四 x 02 782353 2 7 3 4 1 
加 x 10954111 3 7 机 4 o 
加 x x 60 o o 7 8 1 
7 x x 20 45 9 1 8 1 
OECDODTCEDETTS 


a 变 芝 接 负 夫 模 式 寺村 排序 。 

不 使 用 模式 《以 X 标记) 中 的 失 变 章 时 的 完整 个 素数。 
条 个 唯一 模式 的 平均 人 

中 每 个 叭 一 异 式 的 组 理 分 有 


18-16 表格 模式 输出 结果 


18-17~ 图 18-19 给 出 了 EM 算法 的 相关 统计 量 ， 包 括 EM 平均 值 、 协 方差 和 相关 性 。 从 
EM 平均 值 输出 结果 中 可 知 ，age 变量 的 平均 值 为 41.91， 从 EM 协 方差 输出 结果 中 可 知 ，age 和 
tenture 间 的 协 方差 值 为 135.326， 从 EM 相关 性 输出 结果 中 可 知 ，age 与 tenture 的 相关 系数 为 
0.496。 另外 , 从 三 个 表格 下 方 的 利 特 尔 的 MCAR 检验 可 知 , 卡 方 检验 的 显著 性 值 明显 小 于 0.05， 
因此 ， 我 们 拒绝 了 缺失 值 为 完全 随机 缺失 (MCAR) 的 假设 ， 这 也 验证 了 图 18-14 所 得 到 的 
结论 。 


422 


第 18 章 缺失 值 分 析 


EM 平均 值 
8 和 二 
回 和 2 § 加 
36.12 41.91 11.58 77.3941 11.22 2.29 
a. 利 特 尔 MCAR 检验 : 卡 方 = 179.836， 自 由 度 = 107， 重 要 性 = 
000 


18-17 ”EM 平均 值 输出 结果 


EM 协 方差 8 
n a = 
四 呈 E 3 号 
亏 Ey 与 3 Ee 四 
瑟 马 E § 加 
咏 昌 


tenure 460.893 

age 135.326 161.261 

address 111.341 85.440 105.372 

income 547.182 451.109 300.533 7664.75710 

employ 113.359 86.871 48.051 525.81159 103.326 

reside -1.107 -4.538 -3.098 -14.60886 -1.916 2.006 
a. 利 特 尔 MCAR 检验 : 卡 方 = 179.836， 自 由 度 = 107， 重 要 性 = .000 


图 18-18 ”EM 协 方差 输出 结果 


EM 相关 性 ” 
8 和 号 
可 

加 号 § 的 
tenure 1 
age 496 和 
address 505 .655 1 
income 291 .406 334 1 
employ 519 673 461 591 1 
reside -.036 -.252 -.213 -.118 -.133 1 


a. 利 特 尔 MCAR 检验 : 卡 方 = 179.836， 自 由 度 = 107， 重 要 性 = .000 


图 18-19 EM 相关 性 输出 结果 


18.3 上 机 题 


视频 文件 :\ 多 媒体 文件 上 机 题 教 学 视频 \chap18.-wmv 


一 视频 文件 ，\ 源 文件 上 机 题 \shap18\.… 


如 下 表 所 示 ， 该 数据 文件 给 出 了 部 分 国家 相关 指标 的 数值 , 但 是 数据 中 存在 缺失 值 。 试 用 
有 关 方 法 分 析 该 数据 文件 的 缺失 值 是 否 为 随机 缺失 。 (数据 路 径 : 视频 文件 sample\ 上 机 题 
\chap18\ 习 题 \ 第 18 章 第 一 题 .sav) 
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国家 热量 摄 入 | 艾滋 病人 数 | 艾滋 病 发 病 率 成 年 男性 健康 成 年 女性 健康 
(大 卡 ) (人 ) (人 /万 人 ) 状况 得 分 〈 分 ) 状况 得 分 分 ) 
Afghanistan 0 0 44 14 
Argentina 3113 3904 设 96 9 
Armenia 2 0 100 100 
Anustralia 3216 4727 27 100 100 
Anustria 3495 1150 14 
Azerbaijan 100 100 
Bahrain 13 2 55 55 
Bangladesh | 2021 1 0 47 22 
Barbados 418 139 99 99 
Belarus 10 0 100 100 
Belgium 1603 16 
Bolivia 1916 87 1 85 71 
Bosnia 
Botswana 2375 1415 101 4 16 
Brazil 2751 49312 31 82 80 
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统计 图 是 统计 资料 分 析 的 关键 组 成 部 分 , 统计 图 形 用 几何 图 形 或 具体 形象 直观 、 生动 地 描 
述 出 统计 资料 的 相关 信息 ， 掌 握 如 何 利 用 统计 图 形 来 分 析 问 题 是 对 数据 分 析 者 的 一 项 基本 要 
求 。SPSS 24.0 在 包含 更 多 的 统计 分 析 功 能 外 ， 还 提供 了 更 强大 的 绘图 功能 。 

SPSS 24.0 可 以 绘制 的 图 形 包括 条 形 图 、 线 形 图 、 面 积 图 、 箱 图 等 各 种 常用 图 形 ， 几 平 满 
足 了 用 户 的 所 有 需求 。 本 章 将 结合 实例 详细 介绍 如 何 利用 SPSS 24.0 绘制 统计 图 形 。 


19.1 SPSS 24.0 绘图 功能 简介 


SPSS 24.0 的 绘图 功能 十 分 强大 , 与 以 前 的 版 本 有 较 大 不 同 。SPSS 24.0 的 绘图 功能 主要 通 
过 “图 形 ”菜单 实现 。 


19.1.1 “图 形 ” 菜 单 


SPSS 24.0 提供 了 多 种 程序 实现 图 形 绘制 : 图 形 构建 器 、 图 形 画 板 模板 选择 器 、 比 较 子 组 、 
回归 变量 图 和 旧 对 话 框 。 

打开 要 分 析 的 数据 文件 ， 单 击 “ 图 形 ” 菜 单 ， 如 图 19-1 所 示 ， 我 们 可 以 看 到 下 拉 菜 单 中 
有 “图 表 构 建 器 ”“ 图 形 画 板 模板 选择 器 ”和 “ 旧 对 话 框 ” 选 项 。 


内 总 用 往 计 村 抬 提 1.sav [ 熙 所 条 1] -18M SPSS Statistics 数据 全 棋 吕 过 口 x 
文件 器 编辑 E) 下 看 W) 教 据 (D) 转换 分析) 政 销 帅 ) 醒 开 人) 实用 程序 () 扩展 GO 军 口 WN) 帮助 HH) 


Bc) JBM SPSS Statistics 处 理 程序 名 线 | Unicode ON| | 
图 19-1 SPSS 24.0 的 “图 形 ” 菜 单 


当然 , 统计 图 形 除了 通过 “图 形 ” 菜 单 直接 实现 外 ， 部 分 统计 图 形 还 会 伴随 其 他 分 析 过 程 
而 输出 ， 如 回归 分 析 过 程 、 方 差分 析 过 程 等 。 
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19.1.2 ”图 表 构 建 器 简介 


SPSS 24.0 的 图 形 构建 程序 继承 了 以 前 各 版 本 的 优点 ， 用 户 几乎 完全 可 以 通过 鼠标 拖拉 的 
方式 完成 图 形 的 绘图 工作 。 首先 选择 图 形 的 类 型 ,然后 从 类 型 库 中 选择 自己 想 要 输出 的 图 形 描 
述 ， 通 过 将 不 同 的 变量 名 拖 入 对 应 的 坐标 轴 ， 用 户 即 可 以 随心 所 欲 地 绘制 各 种 常用 图 形 。 

打开 要 分 析 的 数据 文件 后 ， 在 菜单 栏 中 选择 “图 形 ”| 图表 构建 器 ”命令 ， 打 开 如 图 19-2 
所 示 的 “图 表 构 建 器 ”对 话 框 。 


冲 夫 预定 各 启示 全 荔 握 
请 将 图 库 中 的 图表 掩 到 此 处 ， 以 将 其 用 作 起 点 
或 者 
地 灌 [区 Bi - 
硬 wrec=11omec=2 单 二 基本 元 素 " 先 项 卡 以 使 东 个 元 素 地 移 浊 图 素 


[EE sse ee Eu 


19-2 “图 表 构 建 器 ”对 话 框 


用 户 使 用 图 表 构建 器 就 可 以 根据 预定 义 的 图 库 图 表 或 图 表 的 单独 部 分 生成 图 表 。“ 图 表 构 
建 器 ”对 话 框 主要 包括 以 下 几 部 分 。 


(1) 画布 

画布 是 “图 表 构 建 器 ”对 话 框 中 生成 图 表 的 区 域 ， 如 图 19-2 所 示 。 在 绘图 过 程 中 ， 用 户 
可 以 通过 用 鼠标 将 图 库 图 表 或 基本 元 素 拖 放 到 画布 中 的 方法 生成 图 表 。 生成 图 表 时 , 画布 会 显 
示 图 表 的 预览 。 


(2) 轴 系 

轴 系 定义 了 特定 坐标 空间 中 的 一 个 或 多 个 轴 。 用 户 在 将 图 库 图 表 拖 放 到 画布 中 时 , “图 表 
构建 器 ”会 自动 创建 轴 系 。 此 外 ， 用 户 也 可 以 从 “基本 元 素 ” 选 项 卡 中 选择 一 个 轴 系 ， 每 个 轴 
都 包含 一 个 用 于 拖 放 变 量 的 轴 放 置 区 , 蓝 色 文字 表示 该 区 域 仍 需要 放置 变量 。 每 个 图 表 都 需要 
将 一 个 变量 添加 到 义 轴 放置 区 。 
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(3) 图 形 元 素 
图 形 元 素 是 图 表 中 表示 数据 的 项 ， 这 些 项 为 条 、 点 、 线 等 。 


(4) “变量 ”列表 

该 列表 框 显示 了 “图 表 构 建 器 ”所 打开 的 数据 文件 中 所 有 可 用 变量 。 如 果 在 此 列表 框 中 所 
选 的 变量 为 分 类 变量 ， 则 “类 别 ” 列 表 框 会 显示 该 变量 的 已 定义 类 别 。 同 样 ， 也 可 使 用 “类 别 ” 
列表 框 查看 构成 多 重 响应 集 的 变量 。 用 户 还 可 以 临时 更 改变 量 的 测量 级 别 ， 方 法 是 在 “变量 ” 
列表 框 中 右 击 该 变量 的 名 称 , 然后 选择 一 个 测量 级 别 以 适合 作 图 , 但 这 不 会 改变 数据 文件 中 实 
际 的 数据 类 型 。 


(5) 放置 区 

放置 区 是 画布 上 的 区 域 , 用户 可 以 将 变量 从 “变量 ”列表 框 中 拖 放 到 这 些 区 域 中 。 本 书 在 
前 面 提 到 过 , 轴 放置 区 是 基本 放置 区 。 某 些 图 库 图 表 包 含 分 组 放置 区 , 这 些 放 置 区 以 及 面板 放 
置 区 和 点 标签 放置 区 也 可 以 从 “组 /点 人 D” 选 项 卡 中 添加 。 

(6) “图 库 ” 选 项 卡 

“图 表 构 建 器 ”对 话 框 默 认 打 开 “ 图 库 ” 选 项 卡 ， 如 图 19-3 所 示 。 

“选择 范围 ”列表 框 包括 “图 表 构建 器 ”可 以 绘制 的 各 种 常用 图 形 及 收藏 夹 ， 单 击 其 中 的 
某 一 图 表 类 型 ， 右 侧 即 显示 该 图 表 类 型 可 用 的 图 库 。 用 户 可 以 选中 所 需 图 表 的 图 片 ， 然 后 将 其 
拖 放 到 画布 上 ,也 可 以 双击 该 图 片 同样 使 其 显示 在 画布 上 。 如 果 画 布 已 显示 了 一 个 图 表 , 则 图 
库 图 表 会 替换 该 图 表 上 的 轴 系 和 图 形 元 素 。 

(7) “基本 元 素 ” 选 项 卡 

在 “图 表 构 建 器 ”对 话 框 中 单 击 “ 基 本 元 素 ” 选 项 卡 ， 如 图 19-4 所 示 。 


19-3 “图 库 ” 选 项 卡 图 19-4 “基本 元 素 ” 选 项 卡 

基本 元 素 包括 轴 和 图 形 元 素 。 这 些 元 素 之 所 以 为 “基本 元 素 ”， 是 因为 缺少 它们 就 无 法 创 
建 图表 。 如 果 用 户 是 第 一 次 使 用 “图 表 构 建 器 ”， 建议 改 用 图 库 图 表 ， 由 于 图 库 图 表 能 够 自动 
设置 属性 并 添加 功能 ， 因 此 可 以 简化 图 形 的 创建 过 程 。“ 选 择 轴 ”中 列 出 了 用 户 可 选 的 5 种 坐 
标 轴 形 式 ，“ 选 择 元 素 ” 中 则 给 出 了 10 种 用 户 可 选 的 图 形 元 素 。 

在 实际 操作 过 程 中 ,如 果 画 布 是 空白 的 , 通常 先 将 一 个 轴 系 拖 到 画布 上 , 然后 拖 动 图 形 元 
素 , 添加 图 形 元 素 类 型 。 值 得 注意 的 是 ， 并 不 是 所 有 图 形 元 素 都 可 以 用 于 特定 轴 系 , 轴 系 只 支 
持 相 关 的 图 形 元 素 。 
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(8) “组 /点 ID” 选 项 卡 

在 “图 表 构 建 器 ”对 话 框 中 单 击 “ 组 /点 ID ”选项 卡 ， 如 图 19-5 所 示 。 

选中 “组 /点 人 D” 选 项 卡 中 的 某 一 复 选 框 ， 将 会 在 画布 中 增加 相应 的 一 个 放置 区 ， 同 理 ， 
也 可 以 通过 撤 选 某 复 选 框 取消 在 画布 中 添加 的 放置 区 。 

(9 ) “标题 /脚注 ”选项 卡 

在 “图 表 构 建 器 ”对 话 框 中 单 击 “ 标 题 /脚注 ”选项 卡 ， 如 图 19-6 所 示 。 


选中 的 硕 稳 对 本 来 添 加 标题 ?0 外 主 * 请 在 "全 性 “中 编辑 文本 。 


19-5 “组 /点 ID” 选 项 卡 19-6 “标题 /脚注 ”选项 卡 
用 户 通过 选中 “标题 /脚注 ”选项 卡 中 相应 的 复 选 框 ， 并 在 “元 素 属性 ”对 话 框 的 “内 容 ” 
文本 框 中 输入 相应 标题 名 或 脚注 名 ， 如 图 19-7 所 示 ， 然 后 单 击 “ 应 用 ”按钮 使 设置 内 容 生 效 ， 
这 样 便 可 以 为 输出 的 图 形 添加 标题 或 脚注 说 明 ; 同 理 , 可 以 通过 撤 选 相应 的 复 选 框 移 去 已 经 设 
置 的 标题 或 脚注 。 


(10) “元 素 属性 ”按钮 

在 “图 表 构 建 器 ”对 话 框 中 单 击 “ 元 素 属性 ”按钮 ， 弹 出 如 图 19-7 所 示 的 “元 素 属性 ” 

“编辑 以 下 对 象 的 属性 ”列表 框 用 以 显示 可 以 进行 属性 设置 的 图 形 元 素 ， 图 19-7 中 显示 
的 图 形 元 素 包括 条 形 图 1、X-Axis1、Y-Axisl 等 。 每 一 种 图 形 元 素 可 以 设置 的 属性 往往 是 不 同 
的 ， 用 户 应 按照 预定 目标 对 相应 元 素 属性 进行 设置 。 

元 素 属性 设置 完毕 后 ， 单 击 “ 应 用 ”按钮 使 设置 生效 。 

(11) “选项 ”按钮 

在 “图 表 构 建 器 ”对 话 框 中 单 击 “ 选 项 ”按钮 ， 弹 出 如 图 19-8 所 示 的 “选项 ”对 话 框 ， 
用 户 可 以 在 此 设置 绘图 时 如 何 处 理 缺 失 值 及 选用 哪些 图 形 面 板 等 。 


中 “用 户 缺 失 值 ” 选项 组 。 该 选项 组 用 于 设置 缺失 值 的 处 理 方式 。 对 于 系统 缺失 值 ，SPSS 
在 绘图 时 将 不 加 以 统计 ; 对 于 分 界 变量 的 缺失 值 有 两 种 处 理 方式 : 

。 “排除 ”表示 绘图 时 忽略 这 些 用 户 定义 缺失 值 ; 

。 “包括 ”表示 绘图 时 把 它们 作为 一 个 单独 的 类 别 加 以 统计 。 

@ “摘要 统计 和 个 案值 ”选项 组 。 该 选项 组 用 于 设置 当 观 测 变量 出 现 用 户 定义 缺失 值 时 
的 处 理 方法 。 
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起 元 二 E 性 x 起 ja 四 
的 用户 卫生 
AST 站 
as CE) 国 外 ee 但是 访 可 以 撒 证 SPSS Statistcs 处 理 
标题 1 
[9 
©#E) 
文本 类 型 : 脚 主 1F) OO 
内 容 C): Ha 人 表 划 
“加 成 列 排 辽 ， 以 确保 图 来 的 个 系 诛 保持 一 致 ) 
日 下 个 到 里 进行 指称 ， 以 售 最 大 限度 地 使 用 数据 


「 模 酸 


如 果 在 "SPSS Statistics 选项 (本 以 通过 数据 编 转 器 中 的 转 辕 "菜单 进行 
访问 ) 中 找 宝 了 模板 ， 那 么 村 首先 应 用 该 入 版 * 然后 ， 迁 中 的 楼 板 桂 技 下 
方 的 列 未 二 序 应 用 。 


深 省 楼 板 : 无 


~ 


EG): 


二 


EE 


EEC Eee 
图 19-7 “元 素 属性 ”对 话 框 图 19-8 “选项 ”对 话 框 
。 “成 列 排除 ， 以 确保 图 表 的 个 案 库 保持 一 致 ”表示 绘图 时 直接 忽略 这 个 观测 ; 
。 “逐个 变量 进行 排除 ， 以 便 最 大 限度 地 使 用 数据 ”表示 只 有 包含 缺失 值 的 变量 用 于 当前 计 
算 和 分 析 时 才 和 忽略 这 个 样本 。 


@ “模板 文件 ”列表 框 。 该 列表 框 用 于 对 绘制 的 模板 文件 进行 设置 。 单 击 “ 添 加 ”按钮 ， 
打开 文件 选择 对 话 框 , 添加 指定 的 预 置 模板 文件 。 绘制 时 最 先 使 用 的 是 系统 默认 模板 ,然后 会 
按 “ 模 板 文件 ”列表 框 中 显示 的 顺序 使 用 ， 靠 后 显示 的 模板 将 会 覆盖 前 面 的 模板 效果 。 

@@ “图 表 大 小 ”文本 框 。 用 于 设置 图 形 显示 的 大 小 ， 默 认 值 为 100%。 

@ “面板 ”选项 组 。 该 选项 组 用 于 图 形 列 过 多 时 的 显示 设置 。 若 选中 “面板 回 绕 ” 复 选 
框 , 则 表示 图 形 列 过 多 时 允许 换行 显示 ; 否则 图 形 列 过 多 时 , 每 行 上 的 图 形 会 自动 缩小 以 显示 
在 同一 行 中 。 

设置 完毕 后 ， 单 击 “ 确 定 ” 按 钮 回 到 主 对 话 框 。 


19.1.3 ”图 形 画 板 模板 选择 器 简介 


图 形 画板 模板 选择 器 为 用 户 提供 了 一 个 绘制 图 形 的 简易 可 视 化 界面 ,用 户 通过 该 程序 可 以 
在 即使 不 清楚 自己 所 要 输出 图 形 类 型 的 情况 下 也 能 顺利 完成 绘制 工作 ,经 过 简单 的 设置 便 能 输 
出 令 自己 满意 的 图 形 。 

打开 要 分 析 的 数据 文件 后 ， 在 菜单 栏 中 选择 “图 形 ”|“ 图 形 画 板 模板 选择 器 ”命令 ， 打 
开 如 图 19-9 所 示 的 “图 形 画板 模板 选择 器 ”对 话 框 。 

“图 形 画板 模板 选择 器 ”对 话 框 中 包括 4 个 选项 卡 : 基本 、 详 细 、 标 题 及 选项 。 下 面 分 别 
进行 介绍 。 
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1.“ 基 本 ”选项 卡 
当 用 户 不 确定 哪 种 直观 表示 类 型 最 能 代表 要 分 析 的 数据 时 ,可 以 使 用 “基本 ”选项 卡 , 用 
户 选择 数据 时 ， 对 话 框 会 自动 显示 适合 数据 的 直观 表示 类 型 子 集 。 


sy) 
(ae) La) srw 
EE 3 ae sm an 


图 19-9 “图 形 画 板 模板 选择 器 ”对 话 框 

(1 ) 变量 列表 杠 

变量 列表 框 将 显示 所 打开 数据 文件 中 的 所 有 变量 。 用 户 可 以 通过 选中 变量 列表 框 上 方 的 
“自然 ” “名 称 ”或 “类 型 ” 单 选 按钮 对 列表 框 中 的 变量 进行 排序 。 选 择 一 个 或 多 个 变量 后 ， 
列表 框 右 侧 会 显示 对 应 可 用 的 直观 表示 图 类 型 。 

(2) “摘要 ”下 拉 列 表 杠 

对 于 某 些 直观 表示 ， 可 以 选择 一 个 摘要 
统计 。 常 用 的 摘要 统计 量 包括 和 、 平 均值 、 
极 小 值 和 极 大 值 等。 

(3 ) 管理 模板 和 样式 表 

单 击 “ 基 本 ”选项 卡 中 的 “管理 ”按钮 ， 
将 弹出 如 图 19-10 所 示 的 “管理 本 地 模板 、 样 
式 表 和 地 图 ”对 话 框 。 

“模板 ”选项 卡 列 出 所 有 本 地 模板 ; “ 样 
式 表 ”选项 卡 列 出 所 有 本 地 样式 表 并 显示 带 ES 二 画面 
有 样本 数据 的 示例 直观 表示 。 用 户 可 以 选择 ”图 19.10 “管理 本 地 模板 、 样 式 表 和 地 图 ”对 话 杠 
一 个 样式 表 将 其 样式 应 用 到 示例 直观 表示 。 

用 户 可 以 在 当前 激活 的 所 有 选项 卡 上 进行 以 下 操作 

。 导入 : 用 于 从 文件 系统 中 导入 直观 表示 模板 或 样式 表 。 导 入 模板 或 样式 表 使 其 可 以 用 于 

SPSS 应 用 程序 。 用户 只 有 在 导入 模板 或 样式 表 后 才能 在 应 用 程序 中 使 用 另 一 个 用 户 发 送 
的 模板 或 样式 表 。 


430 


第 19 章 常用 统计 图 的 绘制 


。 导出 : 用 于 将 直观 表示 模板 或 样式 表 导 出 到 文件 系统 中 。 当 用 户 想 将 模板 或 样式 表 发 送 给 
另 一 个 用 户 时 ， 可 以 将 其 导出 。 
。 重 命名 : 用 于 重 命名 所 选 的 直观 表示 模板 或 样式 表 ， 但 用 户 无 法 将 模板 名 称 更 改 为 已 使 用 


的 名 称 。 
。 导出 地 图 键 : 用 于 将 直观 表示 地 图 键 导出 到 文件 系统 中 。 适 用 于 用 户 将 地 图 键 发 送 给 另 一 
个 用 户 的 情况 。 py 和 
。 删除 : 用 于 删除 所 选 的 直观 表示 模板 或 样式 表 。 i a 
删除 操作 无 法 取消 ， 须 谨慎 进行 。 Glisten 
存 针 库 
(4) 设置 模板 和 样式 表 的 位 置 wie—1XH* 


单 击 “ 基 本 ”选项 卡 中 的 “位 置 ”按钮 ， 弹 出 如 
图 19-11 所 示 的 “模板 、 样 式 表 和 地 图 ”对 话 框 。 此 
对 话 框 用 于 设置 模板 和 样式 表 的 保存 位 置 ， 包 括 两 个 
单 选 按钮 : 


。 “本 地 计算 机 ” 单 选 按钮 。 若 选中 该 单 选 按钮 ， 则 表示 模板 和 样式 表 位 于 本 地 计算 机 上 的 
特定 文件 夹 中 。 在 Windows XP 上 ， 此 文件 夹 是 C:\Documents and Settings\<user>\ 
Application Data\SPSSInc\Graphboard， 文 件 夹 无 法 更 改 。 

。 “存储 库 ” 单 选 按钮 。 若 选中 该 单 选 按钮 ， 则 表示 模板 和 样式 表 位 于 SPSS Predictive 
Enterprise Repository 中 的 用 户 指 定 文件 夹 中 。 要 设置 特定 文件 夹 , 可 单 击 “文件 夹 ” 按钮， 
选择 模板 和 样式 表 存 储 的 所 在 文件 夹 。 

2.“ 详 细 ” 选 项 卡 

当 用 户 知道 自己 想 创建 什么 类 型 的 直观 表示 或 想 将 可 选 外 观 、 面 板 或 动画 添加 到 直观 表示 

中 时 ， 可 以 使 用 “详细 ”选项 卡 。 
在 “图 形 画 板 模板 选择 器 ”对 话 框 中 单 击 “ 详 细 ” 选 项 卡 ， 如 图 19-12 所 示 。 


19-11 “模板 、 样 式 表 和 地 图 ”对 话 框 
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19-12 “详细 ”选项 卡 
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(1) 设置 图 表 类 型 
如 图 19-12 所 示 ，“ 计 数 饼 图 ”所 在 位 置 即 为 “可 视 化 类 型 ”下 拉 列 表 框 ， 用 户 选 择 好 图 
表 类 型 后 ， 将 自动 显示 图 形 的 直观 表示 类 型 。 如 果 用 户 在 “基本 ”选项 卡 中 选择 了 一 个 直观 表 


示 类 型 ， 
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“详细 ”选项 卡 将 显示 该 类 型 。 


(2) 图 表 元 素 简单 设置 
包括 图 表 轴 系 和 摘要 统计 量 的 设置 ， 这 些 选 项 的 功能 分 别 介绍 如 下 : 


“类 别 ” 下 拉 列 表 框 : 用 于 选择 饼 图 扇形 所 代表 的 内 容 。 
“摘要 ”下 拉 列 表 框 : 对 于 某 些 直观 表示 ， 用 户 可 以 选择 一 个 摘要 统计 。 


(3) “可 选 审美 原则 ”选项 组 
用 户 可 以 通过 “可 选 审美 原则 ”选项 组 对 图 形 进行 外 观 显示 设置 ， 设 置 不 同 的 图 形 有 不 同 的 选项 。 
在 “可 视 化 类 型 ”下 拉 列 表 框 中 选择 “中 位 数 分 区 图 上 的 坐标 ”选项 ， 显 示 如 图 19-13 所 示 。 


本 x 
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图 19-13 “详细 ”选项 卡 
“色彩 "下拉 列 表 框 : 当 用 户 使 用 分 类 变量 定义 颜色 时 ， 系 统 将 根据 单个 类 别 拆 分 直观 表示 
图 形 ,每 一 个 类 别 一 种 颜色 。 当 颜色 是 连续 数值 范围 时 ， 则 颜色 根据 变量 的 值 而 不 同 。 如 果 
图 形 元 素 代表 多 个 个 案 ， 且 一 个 范围 变量 用 于 颜色 ， 则 颜色 根据 范围 变量 的 平均 值 而 不 同 。 
“形状 ”下 拉 列 表 框 : 当 用 户 使 用 分 类 变量 定义 形状 时 ， 系 统 将 根据 变量 将 直观 显示 图 形 
拆 分 成 不 同 的 形状 ， 对 每 一 个 类 别 一 种 形状 . 
“大 小 下拉 列表 框 : 当 用 户 使 用 分 类 变量 定义 大 小 时 ， 系 统 则 根据 每 个 类 别 拆 分 直观 显示 
图 形 ， 每 一 类 别 一 个 大 小 。 当 大 小 是 连续 数值 范围 时 ， 则 大 小 根据 变量 的 值 而 不 同 。 如 果 图 
形 元 素 代表 多 个 个 案 ， 且 一 个 范围 变量 用 于 定义 大 小 ， 则 大 小 根据 范围 变量 的 平均 值 而 不 同 。 
“ 适 明 度 * 下 拉 列 表 框 : 当 用 户 使 用 分 类 变量 定义 透明 度 时 ， 系 统 将 根据 单个 类别 拆 分 直观 
表示 ， 每 个 半 别 一 个 透明 度 级 别 。 当 透明 度 是 连续 数值 范围 时 ， 根 据 范围 字段/ 变量 的 值 送 
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明度 名 不 相同 。 如 果 图 形 元 素 代表 多 个 个 案 ， 且 一 个 范围 变量 用 于 透明 度 ， 则 透明 度 根据 范 
围 变量 的 均值 各 不 相同 。 在 最 大 值 处 ， 图 形 元 素 完全 透明 ; 在 最 小 值 处 ， 则 完全 不 透明 。 

。 “数据 标签 ”下 拉 列 表 框 : 任何 类 型 的 数据 都 可 以 用 来 定义 数据 标签 ， 数 据 标签 与 图 形 元 
素 相关 联 。 

(4) “面板 与 动画 ”选项 组 

该 选项 组 用 以 选择 面板 变量 和 动画 变量 ， 经 此 用 户 可 以 得 到 个 性 化 的 图 形 。 


。 “面板 横 跨 ” 下 拉 列表 框 : 用 以 从 中 选择 面板 变量 ， 且 只 能 选择 分 类 变量 。 输 出 图 形 中 将 
为 每 个 类 别 生成 一 个 图 形 ， 但 是 所 有 面板 同时 从 左 至 右 依次 显示 。 面板 对 于 检查 直观 表示 
是 否 取决 于 面板 变量 的 条 件 非常 有 用 。 
。 “面板 向 下 ”下 拉 列表 框 : 用 以 从 中 选择 面板 变量 ， 且 只 能 选择 分 类 变量 。 输 出 图 形 中 将 
按 每 个 类 别 从 上 至 下 依次 生成 一 个 图 形 ， 但 是 所 有 面板 同时 显示 
。 “动画 ”下 拉 列 表 框 : 用 以 从 中 选择 动画 变量 用户 可 以 指定 分 类 变量 或 连续 变量 作为 动 
画 变 量 ， 若 选用 连续 变量 ， 则 变量 值 将 自动 被 拆 分 到 范围 中 。 动 画 与 面板 类 似 ,输出 结果 
从 动画 变量 的 值 中 创建 了 多 个 图 形 ， 但 是 这 些 图 形 不 一 起 显示 ， 
3.“ 标 题 ” 选 项 卡 
在 “图 形 画板 模板 选择 器 ”对 话 框 中 单 击 “ 标 题 ”选项 卡 。 选 中 “使 用 定制 标题 ” 单 选 按 
钮 , 可 以 在 对 应 文本 框 中 设置 输出 图 形 的 标题 、 副 标题 和 脚注 ; 若 采 用 默认 的 “使 用 缺 省 标题 ” 
单 选 按钮 ， 则 不 会 在 输出 图 形 中 添加 任何 标题 和 脚注 。 


4.“ 选 项 ”选项 卡 
用 户 可 以 使 用 此 选项 卡 指定 在 “输出 浏览 器 ”中 出 现 的 输出 标签 、 可 视 化 样式 表 和 缺失 值 
处 理 方法 ， 如 图 19-14 所 示 。 


[ET x 
输出 标 答 样式 大 
ED a es | Beg 


在 久生 看 大 面相 中 。 
用 户 各 和 夺 = ss 
《人 和 tote Nfst 拓 值 ， 但 是 多 可以 指证 SPSS Stassfcs 处 理 有 户 过失 人 方式 


分 mR 量 
ONE) 
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六 人 于 秆 
34 清和 ， 忆 请 作 昌 和 69 个 关系 保持 一 下 中 
品 开 个 安 量 浊 行 交 ,以 久生 类 更 诬 地 使 站 捐 ) 
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19-14 “选项 ”选项 卡 
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(1) “输出 标签 ”选项 组 

该 选项 组 用 于 设置 在 “输出 浏览 器 ”的 概要 窗 格 中 出 现 的 文本 ， 用 户 可 以 在 “标签 ”文本 
框 中 输入 想 要 输出 的 内 容 。 默 认 标 签 是 根据 变量 和 模板 选择 而 产生 的 ,如果 更 改 了 标签 ， 后 来 
又 希望 恢复 默认 标签 ， 则 单 击 “ 默 认 ” 按 钮 即 可 。 

(2) “样式 表 ” 选 项 组 

用 户 可 以 单 击 “ 选 择 ” 按 钮 选择 可 视 化 样式 表 用 于 指定 可 视 化 的 样式 属性 。 

(3) “用 户 缺 失 值 ”选项 组 

该 选项 组 用 于 设置 所 分 析 数 据 缺 失 值 的 处 理 方式 , 各 选项 组 功能 与 前 文 所 述 一 致 , 在 此 不 
再 更 述 。 


19.1.4 ” 旧 对 话 框 模式 创建 图 形 


利用 旧 对 话 框 模式 创建 图 形 是 利用 SPSS 直接 生成 图 形 的 重要 手段 之 一 ， 它 主要 通过 对 两 个 对 
话 框 的 设置 来 完成 图 形 的 绘制 。 与 使 用 “图 形 画 板 模板 选择 器 ”对 话 框 中 的 “详细 ”选项 卡 类 似 ， 
使 用 旧 对 话 框 模式 创建 图 形 一 般 要 求 用 户 对 所 要 输出 的 图 形 直观 表示 有 一 个 较为 清醒 的 认识 。 

通过 “图 形 ” 菜单 中 的 “ 旧 对 话 框 ” 子 菜单 可 以 绘制 的 图 形 种 类 有 : 条 形 图 、 三 维 条 形 图 、 
线 图 、 面 积 图 、 饼 图 、 高 低 图 、 箱 图 、 误 差 条 形 图 、 金 字 塔 图 、 散 点 图 和 直方 图 等 。 下 面 以 条 
形 图 的 创建 为 例 ， 简 单 说 明 如 何 利 用 旧 对 话 框 模式 创建 图 形 。 


1) 打开 要 分 析 的 数据 文件 后 ， 在 菜单 栏 中 选择 “图 形 ”|“ 旧 对 话 框 ”|“ 条 形 图 ”命令 ， 
打开 如 图 19-15 所 示 的 “条 形 图 ”对 话 框 。 

“条 形 图 ”对 话 框 主要 包括 两 部 分 。 对 话 框 上 半 部 分 显示 要 创建 的 图 形 类 型 的 各 种 直观 表 
示 ， 如 对 于 条 形 图 ， 用 户 可 以 选择 的 图 形 类 型 有 “简单 ”“ 簇 状 ” 和 “堆积 ”3 种 ， 用 户 应 结 
合 各 种 图 形 类 的 特征 和 自己 的 分 析 目 的 选择 一 种 直观 表示 。 

“图 表 中 的 数据 为 ”选项 组 用 于 选择 要 在 图 形 中 分 析 和 现实 的 数据 。 为 方便 下 文 描述 , 假 
设 用 户 选 中 “个 案 组 摘要 ” 单 选 按 钮 。 

2) 当 用 户 设置 好 图 形 直观 表示 及 显示 数据 后 ， 单 击 “ 条 形 图 ”对 话 框 中 的 “定义 ”按钮 ， 
将 弹出 如 图 19-16 所 示 的 “定义 简单 条 形 图 : 个 案 组 摘要 ”对 话 框 , 可 在 此 进行 图 形 详细 设置 。 


@ “条 形 表示 ”选项 组 。 该 选项 组 用 于 选择 输出 图 形 要 显示 的 摘要 统计 量 。 除 对 话 框 中 
显示 的 摘要 统计 量 外 ， 用 户 还 可 以 更 改 输出 的 统计 量 ， 具 体 步骤 为 : 选中 “其 他 统计 ” 单 选 按 
钮 ， 然 后 从 变量 列表 框 中 选择 相应 的 变量 进入 “变量 ”列表 框 中 ， 单 击 “ 更 改 统计 ”按钮 ， 从 
打开 的 对 话 框 中 选择 想 要 输出 的 统计 量 ， 最 后 单 击 “ 继 续 ” 按 钮 即 可 完成 设置 。 

@@ “类 别 轴 ” 列 表 框 。 该 列表 框 用 于 从 变量 列表 框 中 选 入 XX 轴 要 表示 的 变量 。 

@“ 面 板 划分 依据 ”选项 组 。 该 选项 组 用 于 对 要 输出 的 面板 图 形 进 行 设置 ,“ 行 "和 “ 列 ” 
列表 框 用 于 选 入 行 或 列 面板 变量 。 对 于 某 些 图 表 ， 仅 可 按 行 或 列 生成 面板 ， 而 对 于 其 他 图 表 ， 
则 同时 按 行 和 列 生成 面板 。 

如 果 行 或 列 中 的 变量 嵌 套 ， 则 可 选中 “ 嵌 套 变量 〈 无 空 行 / 列 )” 复 选 框 ， 表 示 仅 针对 每 个 
棋 套 而 不 是 每 个 类 别 组 合 创建 面板 。 如 果 变 量 的 含义 依赖 于 其 他 变量 的 值 ， 则 该 变量 是 嵌 套 的 。 
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图 19-15 “条 形 图 ”对 话 框 图 19-16 “定义 简单 条 形 图 : 个 案 组 摘要 ”对 话 框 


如 果 未 选中 “ 翌 套 变量 无 空 行 / 列 ) ” 复 选 框 ， 则 变量 会 存在 交 又 ， 这 意味 着 将 为 每 个 
变量 中 的 每 个 类 别 组 合 创建 一 个 面板 。 如 果 变 量 嵌 套 ， 这 会 导致 出 现 空 列 或 空 行 。 

@@ “要 使 用 的 图 表 指 定 项 的 来 源 ” 复 选 框 。 用 于 打开 图 形 显示 模板 ， 选 中 该 复 选 框 后 ， 
可 单 击 “文件 ”按钮 选择 相应 模板 。 

@ “标题 ”按钮 。 单 击 该 按钮 ， 打 开 如 图 
19-17 所 示 的 “标题 ”对 话 框 ， 用 户 可 以 在 此 设 
置 输出 图 形 的 标题 和 脚注 等 。 设 置 完毕 后 单 击 25 
“继续 "按钮 , 即 可 回 到 主 对 话 框 进行 其 他 设置 。 。 :sy 一 一 一 一 一 一 一 

“选项 ”按钮 。 在 打开 的 “选项 ”对 话 


县 主 
框 中 可 以 对 缺失 值 的 处 理 及 误差 条 形 图 等 进行 全 


生生 法 


标题 


:| 


设置 。 2:[ | 
3) 输出 图 形 所 有 设置 完毕 后 ， 单 击 对 话 [Ee EE 

框 中 的 “确定 ”按钮 ， 即 可 从 SPSS Statistics rs 

查看 器 窗口 中 输出 设置 好 的 图 形 。 图 19-17 “标题 ” 对话 框 


19.2 条 形 图 


条 形 图 用 线条 的 长 短 或 高 低 来 表现 性 质 相近 的 间断 性 资料 的 特征 ,适用 于 描绘 分 类 变量 的 
取 值 大 小 及 比例 等 特点 。 

如 图 19-18 所 示 的 条 形 图 的 示例 , 该 条 形 图 是 用 图 中 线条 的 高 低 或 长 短 表示 不 同 国家 汽车 
平均 发 动机 排 量 的 。 


435 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


各 国 汽车 六 均 发 动机 排 量 


和 
守 六 站) 涉 方 兰 闪 沪 (N) 会 这 


EE 


网 济 日 本 


版 产 国 家 一 区 | 横 轩 标题 


19-18 条 形 图 示例 
19.2.1 常用 条 开 


SPSS 24.0 提供 了 9 种 组 合 绘制 不 同 数据 类 型 的 条 形 图 ,9 种 组 合 可 以 由 3 种 常用 图 形 和 3 
种 描述 模式 组 合 而 成 ， 下 面 将 对 其 分 别 进行 说 明 。 


1. 条 形 图 常用 的 图 形 类 型 
条 形 图 常用 的 图 形 类 型 有 3 种 ， 分 别 是 简单 条 形 图 、 分 类 条 形 图 和 分 段 条 形 图 。 


(1) 简单 条 形 图 

又 称 单 式 条 形 图 ,该 条 形 图 用 单个 条 形 对 每 一 个 类 别 、 观 测 或 变量 做 对 比 ， 用 间隔 的 等 宽 
条 表示 各 类 统计 数据 的 大 小 , 主要 由 两 个 统计 量 决定 。 通 过 简单 条 形 图 可 以 清楚 地 看 到 各 类 数 
据 间 的 对 比 情况 。 


(2 ) 分 类 条 形 图 

又 称 集群 条 形 图 , 适用 于 对 两 个 变量 交叉 分 类 的 描述 。 该 条 形 图 使 用 一 组 条 形 对 指标 进行 
对 比 , 每 个 组 的 位 置 是 一 个 变量 的 取 值 , 与 其 紧密 排列 的 条 带 是 以 不 同 颜色 标记 的 另 一 个 变量 
的 取 值 , 因此 图 形 主要 由 3 个 变量 决定 。 分 类 图 形 可 以 看 作 是 简单 条 形 图 中 的 每 一 条 带 对 应 数 
据 根据 其 他 变量 所 做 的 进一步 分 类 。 


(3 ) 分 段 条 形 图 

又 称 堆栈 条 形 图 , 适用 于 对 两 个 变量 交叉 分 类 的 描述 。 该 图 中 每 个 条 的 位 置 是 其 中 一 个 变 
量 取 值 , 条 的 长 度 是 要 描述 的 统计 量 的 值 , 但 是 条 带 按 照 另 一 个 变量 各 类 别 所 占 的 比例 被 划分 
为 多 个 段 ， 并 用 不 同 的 颜色 或 阴影 来 表示 各 个 分 段 。 


2. 条 形 图 的 描述 方法 
每 种 条 形 图 的 图 形 类 型 分 别 对 应 3 种 描述 方法 :个 案 分 组 模式 、 变 量 分 组 模式 和 个 案 模 式 。 
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(1) 个 案 分 组 模式 
此 模式 将 根据 分 组 变量 对 所 有 个 案 进 行 分 组 ， 根 据 分 组 后 的 个 案 数 据 创建 条 形 图 。 


(2) 变量 分 组 模式 
此 模式 可 以 描述 多 个 变量 , 简单 类 型 的 条 形 图 能 描述 文件 的 每 一 个 变量 ; 复杂 类 型 的 条 形 
图 能 使 用 另 一 个 分 类 变量 描述 一 个 变量 。 


(3 ) 个 案 模式 
此 模式 将 为 分 组 变量 中 的 每 个 观测 值 生 成 一 个 条 形 图 , 因此 个 案 模 式 适用 于 对 原始 数据 进 
行 一 定 整理 后 形成 的 概括 性 数据 文件 。 


19.2.2 ”简单 条 形 图 的 SPSS 操作 


下 面 将 以 “19-1” 数 据 文件 讲解 简单 条 形 图 的 SPSS 操作 过 程 并 对 输出 图 形 进行 说 明 。 

“19-1” 数 据 文件 来 源 于 SPSS 24.0 自 带 的 数据 文件 “Cars.sav”， 该 假设 数据 文件 涉及 各 
种 汽车 的 mpg、 发 动机 排 量 、 马 力 、 重 量 、 加 速 、 年 份 、 原 产地 、 和 气缸 和 过 滤器 等 方面 数据 ， 
每 个 个 案 对 应 一 辆 汽车 。 我 们 关心 的 是 不 同 原 产 国 家 汽车 的 平均 发 动机 排 量 (mpg) 。 

1. 实验 数据 描述 


打开 “19-1” 数 据 文件 ， 在 SPSS Statistics 数据 编辑 器 窗口 中 可 以 看 到 “19-1” 数 据 文件 
中 的 变量 描述 ， 如 图 19-19 所 示 。 


二 节 用 院 睹 图 瞧 制 1.sav | 数 抽 入 1] - 16M SpSS Statistics 客 到 深思 三 二 大 辣 辣 -有 


车 畏 重 里 ( 辜 》 沽 右 依 村 民 \ 输 入 
从 英里 /小 时 再 右 ,jp 标 度 纳入 
苑 式 年 份 (入 1 泻 右 再 有 床 上 负 入 
原 产 败家 要 右 记名 X 入 输入 
汽 打数 王 右 哺 有 尺 、\ 利和 
cyrec = 11 cytr. 型 右 理 有 序 入 铂 入 


[EN SPSS Staistics 外 理 程 并 线 | | |UnicodeON[ 


图 19-19 “19-1” 数 据 文件 的 变量 描述 
2. 用 图 表 构 建 器 绘制 简单 条 形 图 
有 具体 操作 过 程 如 下 : 


1) 打开 “19-1” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 ” 
|“ 图 表 构 建 器 ”命令 ， 打 开 “ 图 表 构 建 器 ”对 话 框 。 
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2) 在 “选择 范围 ”列表 框 中 选择 “条 形 图 ”， 然 后 从 右 侧 显示 的 直观 表示 中 双击 简单 条 形 图 
直观 表示 nl 或 将 其 选中 拖 入 画布 中 。 从 “变量 ”列表 框 中 选中 “ 原 产 国家 [ 原 产 地 ]” 变 量 并 拖 至 
和 X 轴 变量 放置 区 ， 选 择 “ 发 动机 排 量 〈 立 方 英寸 ) ” 拖 至 YY 轴 变 量 放置 区 ， 如 图 19-20 所 示 。 


天 部 或 年 份 ( 模 100》 
贷 原 产 国家 嘎 产 过 | 
Bcl 


二 siec=ilomec=z | 


[Le ja [sse | ma | ww | 
19-20 “图 表 构建 器 ”对 话 框 


3) 设置 图 形 元 素 的 属性 。 

。 在 “元 素 属 性 ”对 话 框 ， 选 择 “ 平 均值 ”作为 输出 统计 量 ， 并 选中 “显示 误差 条 形 图 ” 复 
选 框 ， 单 击 “应 用 ”按钮 使 设置 生效 ; 

。 在“ 元素 属性 ”对 话 框 中 选择 X-Axisl 进入 X 轴 元 素 属性 设置 对 话 框 ， 根 据 需要 进行 相应 
的 设置 ， 然 后 单 击 “ 应 用 ”按钮 使 设置 生效 ; 

。 在“ 元素 属性 ”对 话 框 中 单 击 Y-Axisl 进入 立 轴 元 素 属性 设置 对 话 框 ， 在 “ 轴 标 签 ”文本 
框 中 输入 “平均 发 动机 排 量 ”作为 Y 轴 标 签 ， 其 他 采用 默认 设置 ， 然 后 单 击 “ 应 用 ”按钮 
使 设置 生效 。 


4) 单 击 “ 标 题 /脚注 ”选项 卡 ， 选 中 “标题 1” 复 选 框 ， 在 “内 容 ” 文 本 框 中 输入 “各 国 
汽车 平均 发 动机 排 量 ”， 最 后 单 击 “ 应 用 ”按钮 保存 设置 。 

5) 输出 图 形 。 

所 有 设置 完毕 后 ， 单 击 “ 图 表 构建 器 ”对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 
查看 器 窗口 中 输出 图 形 ， 如 图 19-21 所 示 。 

从 图 中 可 以 明显 看 出 , 美国 产 汽车 平均 发 动机 排 量 远 远 高 于 欧洲 和 日 本 所 产 汽车 , 该 图 还 
反映 出 95% 的 置信 度 下 各 国生 产 汽车 发 动机 排 量 均值 的 变异 。 

上 例 简 要 说 明了 简单 条 形 图 下 个 案 分 组 模式 的 操作 过 程 , 简单 条 形 图 的 变量 分 组 和 个 案 模 
式 做 法 与 此 类 似 ， 故 在 此 不 再 做 单独 介绍 。 
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各 国 汽 车 平均 发 动机 排 重 
ao 
加 Ea 
动 
人 
| | | 
b 
x EE 日 
诛 产 国家 
误 基 条 形 图 5% Cl 


图 19-21 简单 条 形 图 输出 结果 
3. 用 图 形 画 板 模 板 选择 器 绘制 简单 条 形 图 
本 例 使 用 的 数据 文件 依然 是 “19-1” 数 据 文件 ， 我 们 将 使 用 图 形 画 板 模板 选择 器 得 到 与 图 
19-21 相似 的 输出 结果 。 


1) 打开 “19-1” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 ” 
| “图 形 画 板 模板 选择 器 ”命令 ， 打 开 “ 图 形 画 板 模板 选择 器 ”对 话 框 ， 如 图 19-22 所 示 。 


| 依 车 本 重生 ( 硬 ) 
CE 
‘ 


yp Pr 
皖 ~ 二 | 双 || 轩 || 丽 


了 UL 
| 
发 动机 阐 里 《立方 而 寸 ) = 

二 i 
和 
a LR ttn 
[ns] sme) sam) nA sm 


图 19-22 “图 形 画板 模板 选择 器 ”对 话 框 
2) 从 变量 列表 框 中 选择 “ 原 产 国家 ”和 “发 动机 排 量 立方 英寸 ) ”两 个 变量 ， 对 话 框 
右 侧 将 显示 可 用 的 图 形 直观 表示 ， 有 条 形 图 、 饼 图 、 三 维 饼 图 、 线 图 、 面 积 图 等 ， 从 中 选择 条 
形 图 直观 表示 [加 ， 从 “摘要 ”下 拉 列 表 框 中 选择 “均值 ”作为 输出 摘要 统计 量 。 
3) 单 击 “ 详 细 ” 选 项 卡 ， 这 里 采用 默认 设置 ， 如 图 19-23 所 示 。 


439 


SPSS 统计 分 析 从 入 门 到 精通 (第 四 版 ) 


Mr 
| wro [加 
| 
Ee Le rermm 
LE jew sae) eA 


19-23 “详细 ”选项 卡 设置 
4) 单 击 “ 标 题 ”选项 卡 ， 选 中 “使 用 定制 标题 ” 单 选 按钮 ， 在 “标题 ”文本 框 中 输入 “各 
国 汽车 平均 发 动机 排 量 ”。 
5) 单 击 “ 选 项 ”选项 卡 ， 在 “输出 标签 ”选项 组 的 “标签 ” 
文本 框 中 输入 “简单 条 形 图 : 发 动机 排 量 - 原 产地 ”， 其 他 采用 默 
认 设 置 。 


入 条 一 x 


6) 输出 图 形 。 加 
所 有 设置 结束 后 ， 单 击 “ 图 形 画 板 模板 选择 器 ”对 话 框 中 的 
“确定 ”按钮 ， 在 SPSS Statistics 查看 器 中 窗口 即 输出 与 图 19-21 [ld se 


相似 的 图 形 。 
图 夫 中 的 数据 为 
4. 使 用 旧 对 话 框 绘制 简单 条 形 图 加 个 过 组 摘要 (G) 
个 单 抽奖 量 的 摘要 CV) 
1) 打开 “19-1” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗 名 单个 个 案 的 人 由 


口 ， 在 菜单 栏 中 选择 “图 形 ”|“ 旧 对 话 框 ” | “条 形 图 ” 命令 , 打 [二 E 四 ED 
开 “ 条 形 图 ”对 话 框 。 选 择 “ 简 单 ”直观 表示 ， 在 “图 表 中 的 数 
据 为 ”选项 组 中 选中 “个 案 组 摘要 ” 单 选 按钮 ， 如 图 19-24 所 示 。 图 19-24 “条 形 图 ”对 话 杠 

该 对 话 框 包括 条 形 图 类 型 直观 显示 : 简单 、 饶 状 和 堆积 , 也 包括 各 种 图 形 类 型 的 3 种 模式 : 
个 案 组 摘要 、 单 独 变量 的 摘要 和 单个 个 案 的 值 。 

2) 单 击 “ 定 义 ”按钮 ， 弹 出 “定义 简单 条 形 图 ， 个 案 组 摘要 ”对 话 框 ， 从 “条 形 表示 
选项 组 中 选中 “其 他 统计 ” 单 选 按钮 ， 并 从 变量 列表 框 中 将 “发 动机 排 量 ” 变 量 选 入 “变量 ” 
列表 框 中 ， 系 统 默认 表 的 特征 为 发 动机 排 量 的 均值 。 将 “ 原 产 国家 ”变量 选 入 “类 别 轴 ” 列 表 
框 中 ， 其 他 采用 默认 设置 ， 如 图 19-25 所 示 。 


“条 形 表示 ”选项 组 用 于 定义 确定 条 形 图 中 条 带 的 长 度 的 统计 量 ， 各 选项 含义 如 下 : 


。 个 案 数 : 选中 该 单 选 按钮 ， 表示 条 形 图 的 长 度 为 分 类 变量 值 的 观测 数 。 条 形 图 中 条 的 长 度 表 
示 频 率 ， 分 类 变量 可 以 是 字符 型 变量 或 数值 型 变量 。 该 选项 为 系统 默认 选项 。 
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。 个 案 百分比 : 选中 该 单 选 按钮 ， 表 示 条 形 图 的 长 度 为 分 类 变量 的 观测 在 总 观测 中 所 占 的 比 
重 ， 即 以 频率 作为 统计 量 。 

。 累计 个 案 数 : 选中 该 单 选 按钮 ， 表 示 条 形 图 的 长 度 为 分 类 变量 中 到 某 一 值 的 累积 频数 ， 即 
分 类 变量 的 当前 值 对 应 的 个 案 数 与 以 前 各 值 对 应 的 总 个 案 数 。 

。 累计 百分比 : 选中 该 单 选 按钮 ， 表 示 条 形 图 的 长 度 为 分 类 变量 中 到 某 一 值 的 累积 百分比 ， 
即 条 的 长 度 表示 的 是 累计 频率 。 

。 其 他 统计 : 选中 该 单 选 按钮 ， 则 “变量 ”列表 框 被 激活 ， 选 入 变量 后 ， 系 统 默认 设置 对 该 
变量 的 数据 取 平 均值 ， 并 作为 条 形 图 的 长 度 。 

如 果 想 选择 其 他 的 表示 ， 则 可 单 击 “ 更 改 统计 ”按钮 ， 打 开 如 图 19-26 所 示 的 “统计 ”对 

话 框 。 


PY 个 x 
F 并 表示 
CN | © + OfRE4HW | gd) 
Se, 医生 | | 人 轩 计 个 和 () 加 林寺 下 分 此) - 
伊 从 0 其 时 路 9 加速 。 | ， 国 其 他 统计 《他 tp 平 均 才 ) [5) 前 统 计 x 
缚 条 开征 份 ( 模 100) el 
,|| MW) [2 vemonanhA (oA BI- | 计 定 认 时 人 统计 
ER mi Em 
一 一 器 全 的 中 位 数 (0) 名 方差 W 
i Ch 
二 D 个 村 SG) 。。 口 最 大 值 o0) 
fe 口 值 的 总 和 (E) 。。 口 累计 求 和 UU) 
C3 入): 
国 Fea 口上 方 百分比 E) 口上 方 数目 和 
au 加 下方 百分比 C) 加 下 方 数目 四 ) 
| 昌 百 分 他 数 中 
| LE 低 这 高 (4): 
名 区间 内 百分比 (G) © 区 间 内 数目 GE) 
要 使 用 的 可 表 证 大 69 未 源 (U): 
国 值 是 分 组 中 点 0 
CE Wa) a ee 司 [sj Lm Law | 
图 19-25 “定义 简单 条 形 图 : 个 案 组 摘要 ”对 话 框 图 19-26 “统计 ”对 话 框 


在 “统计 ”对 话 框 中 可 以 选择 总 体 特征 的 描述 统计 量 、 单 侧 区 间 数 据 的 特征 描述 统计 量 和 
双 侧 区 间 数 据 的 特征 描述 统计 量 。 总 体 特征 的 描述 统计 量 设置 较为 简单 ,下面 将 重点 介绍 单 侧 
区 间 的 特征 描述 统计 量 和 双 侧 区 间 的 特征 描述 统计 量 的 设置 。 


。 单 侧 区 间 的 特征 描述 统计 量 . “统计 ”对 话 框 中 间 给 出 了 单 侧 区 间 数 据 特征 的 描述 统计 量 ， 

当选 择 该 部 分 中 的 选项 时 ， 上 方 的 “ 值 ”文本 框 被 激活 ， 在 文本 框 中 输入 数值 ， 表 示 单 侧 

区 间 的 内 界 。 按 照 原 有 数据 与 内 界 的 大 小 关系 ， 可 将 所 有 数据 划分 为 两 个 区 间 ， 即 大 于 该 

值 的 区 间 和 小 于 该 值 的 区 间 ， 各 单 选 按钮 含义 分 别 介绍 如 下 : 

> 车 选中 “上 方 百分比 ” 单 选 按钮 ， 则 以 变量 值 大 于 闪 值 ( 内 界 ) 的 比例 作为 条 形 的 长 
度 ，“ 下 方 百分比 ” 单 选 按钮 的 含义 恰好 相反 ; 

> 车 选中 “ 百 分 位 数 ” 单 选 按钮 ， 则 表示 以 变量 值 的 百 分 位 数 作为 条 形 的 长 度 ; 

> 若 选 中 “上 方 数目 ” 单 选 按钮 ， 则 表示 以 变量 值 大 于 阀 值 的 个 数 作 为 条 形 的 长 度 ，“ 下 
方 数目 ” 单 选 按钮 含义 与 之 相反 。 
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。 双 侧 区 间 的 特征 描述 统计 量 。“ 统 计 ” 对 话 框 下 方 给 出 了 双 侧 区 间 数 据 特 征 的 描述 统计 量 。 
当选 择 该 部 分 中 的 选项 时 ， 上 方 的 “ 低 ” 和 “高 ”文本 框 被 激活 ， 分 别 用 于 输入 区 间 的 下 
限 和 上 限 。 各 单 选 按钮 含义 分 别 介绍 如 下 : 
> 若 选 中 “区 间 内 百分比 ” 单 选 按钮 ， 则 表示 以 变量 值 在 该 区 间 的 比例 为 纵 轴 ; 
> 若 选中 “区 间 内 数目 ” 单 选 按钮 ， 则 表示 以 变量 值 在 指定 

区 间 的 数目 为 条 形 长 度 。 

。 “ 值 是 分 组 中 点 ” 复 选 框 。 若 选中 该 复 选 框 ， 则 表示 值 由 中 点 
分 类 。 

3) 在 “定义 简单 条 形 图 : 个 案 组 摘要 ”对 话 框 中 单 击 “ 标 题 ” 
按钮 ， 打 开 “ 标 题 ” 对 话 框 ， 在 “标题 ”选项 组 “第 1 行 ” 文 本 框 
中 输入 “各 国 汽车 平均 发 动机 排 量 ”字样 。 设 置 完毕 后 ， 单 击 “ 继 
续 ” 按 钮 ， 返 回 主 对 话 框 。 

4) 单 击 “ 选 项 ”按钮 ， 打 开 “ 选 项 ”对 话 框 。 用 户 可 以 在 该 
对 话 框 中 设置 对 缺失 值 的 处 理 方法 、 是 否 显示 误差 条 形 图 及 误差 条 
形 图 的 内 容 ， 图 表 的 可 用 选项 取决 于 图 表 的 类 型 和 数据 。 选 中 “ 显 
示 误 差 条 形 图 ” 复 选 框 ， 其 他 采用 默认 设置 ， 如 图 19-27 所 示 。 

“选项 ”对 话 框 中 其 他 选项 的 介绍 如 下 : 19-27 “选项 ”对 话 框 

。 “缺失 值 ”选项 组 : 用 户 若 选中 “成 列 排除 个 案 ” 单 选 按钮 ， 则 表示 被 摘要 的 变量 存在 钠 
失 值 时 会 从 整个 图 表 中 排除 个 案 ; 若 选中 “ 按 变量 排除 个 案 ” 单 选 按钮 ， 则 表示 可 从 每 个 
计算 的 摘要 统计 量 中 排除 单个 缺失 个 案 ， 不 同 的 图 表 元 素 可 能 基于 不 同 的 个 案 组 。 

e “显示 带 有 个 案 标签 的 图 表 ” 复 选 框 : 若 选中 该 复 选 框 , 则 表示 在 图 中 显示 个 案 的 标签 值 。 

设置 完毕 后 ， 单 击 “ 继 续 ” 按 钮 ， 则 可 返回 主 对 话 框 中 进行 其 他 设置 。 

5) 输出 图 形 。 

所 有 设置 完毕 后 ， 单 击 “ 定 义 简 单条 形 图 : 个 案 组 摘要 ”对 话 框 中 的 “确定 ” 按钮 ， 即 

可 在 SPSS Statistics 查看 器 窗口 中 输出 图 形 ， 结 果 如 图 19-28 所 示 。 


各 国 汽车 平均 发 动机 拓 量 


aa 
| | | | 
xp Ea 引 本 


原 产 国家 


(44 济 斗 片 ) 部 闪 苦 当 济 写 芝 卡 


过 等 条 形 图 ，95% Cl 


19-28 简单 条 形 图 输出 结果 


442 


第 19 章 常用 统计 图 的 绘制 


19.2.3 ”分 类 条 形 图 的 SPSS 操作 


分 类 条 形 图 能 够 反映 更 多 的 信息 ， 它 对 X 轴 的 每 个 取 值 再 按 某 个 指标 进一步 细 分 ， 并 作 
出 关于 所 得 子 类 别 的 条 形 图。 

在 本 小 节 中 ,我 们 将 继续 利用 “19-1” 数 据 文件 ， 得 到 不 同 原 产 国家 下 按 气 缸 数 分 类 的 平 
均 发 动机 排 量 条 形 图 , 观察 原 产地 和 汽缸 数 对 发 动机 排 量 均值 的 影响 。 下 面 将 详细 介绍 如 何 利 
用 图 形 画 板 模板 选择 器 绘制 分 类 条 形 图 。 

1) 打开 “19-1” 数据 文件 , 进入 SPSS Statistics 数据 编辑 器 窗口 , 在 菜单 栏 中 依次 选择 “图 
形 ”|“ 图 形 画板 模板 选择 器 ”命令 ， 打 开 “ 图 形 画 板 模板 选择 器 ”对 话 框 。 

2) 从 变量 列表 框 中 选择 “ 原 产 国 家 ”和 “发 动机 排 量 ”两 个 变量 ， 从 中 选择 条 形 图 直观 表 
示 辐 ， 从 “摘要 ”下 拉 列 表 框 中 选择 “均值 ”作为 输出 摘要 统计 量 。 

3) 单 击 “ 详 细 ” 选 项 卡 ， 从 “可 选 审 美原 则 ”选项 组 的 “色彩 ”下 拉 列 表 框 中 选择 “ 汽 佐 
数 ”， 如 图 19-29 所 示 。 

4) 在 “标题 ”选项 卡 中 为 图 标 添加 “各 国 汽车 平均 发 动机 排 量 ”标题 ， 其 他 均 采 用 默认 
设置 。 

5) 输出 图 形 。 

所 有 设置 结束 后 ， 单 击 “ 确 定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 中 输出 图 形 ， 结 
果 如 图 19-30 所 示 。 
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人 
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面 怕 与 动因 100-] 
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国 
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Frere 民国 家 


图 19-29 “详细 ”选项 卡 图 19-30 分 类 条 形 图 输出 结果 
19.2.4 ”分 段 条 形 图 的 SPSS 操作 
分 段 条 形 图 或 堆积 条 形 图 与 分 类 条 形 图 相似 ,区 别 只 是 堆积 条 形 图 不 把 子 类 别 分 散 开 来 做 
条 形 图 ， 而 是 将 其 逐次 堆积 在 Y 轴 方 向 上 ， 以 便于 更 好 地 比较 总 值 的 大 小 。 


本 小 节 将 继续 利用 “19-1” 数 据 文件 ， 得 到 不 同 原 产 国家 下 按 气缸 数 分 类 的 平均 发 动机 排 
量 条 形 图 ， 观 察 原 产 地 和 汽缸 数 对 发 动机 排 量 均值 的 影响 。 
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下 面 将 详细 介绍 如 何 利用 图 表 构建 器 绘制 分 段 条 形 图 。 


1) 打开 “19-1” 数据 文件 ,进入 SPSS Statistics 数据 编辑 器 窗口 ,在 菜单 栏 中 选择 “图 形 ” 
| “图表 构建 器 ”命令 ， 打 开 “ 图 表 构 建 器 ”对 话 框 。 

2) 在 “选择 范围 ”列表 框 中 选择 “条 形 图 ”， 然 后 从 右 侧 显示 的 直观 表示 中 双击 分 类 条 
形 图 直观 表示 嚼 或 将 其 选择 拖 入 画布 中 。 从 变量 列表 框 中 选择 “ 原 产 国家 [ 原 产地 ] ”变量 并 拖 
至 义 轴 变量 放置 区 ， 选 择 “ 发 动机 排 量 (立方 英寸 ) ” 拖 至 立轴 变量 放置 区 ， 将 “汽缸 数 ” 
拖 入 “堆积 ”变量 放置 区 ， 如 图 19-31 所 示 。 


19-31 “图 表 构建 器 ”对 话 框 设 置 结果 


3) 为 图 表 添加 “各 国 不 同 汽缸 数 汽车 发 动机 排 量 均值 图 ”标题 ， 其 他 均 采 用 默认 设置 。 

4) 输出 图 形 。 

所 有 设置 结束 后 ， 单 击 “ 确 定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 中 输出 图 形 ， 结 
果 如 图 19-32 所 示 。 


各 国 不 同 汽缸 数 汽车 发 动机 排 量 均 值 图 
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19-32 分 段 条 形 图 输出 结果 
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19.3 线 图 


线 图 是 用 线段 的 升降 在 坐标 系 中 表示 某 一 变量 的 变化 趋势 或 某 变量 随时 间 变 化 的 过 程 的 
图 形 。 线 图 适用 于 连续 性 资料 ， 通 常用 来 表示 两 个 因素 之 间 的 关系 ， 即 当 一 个 因素 变化 时 ， 另 
一 个 因素 对 应 的 变化 情况 。 

图 19-33 所 示 为 线 图 的 示例 , 该 图 用 线段 的 升降 表示 出 不 同 原 产 国家 各 个 马力 阶段 的 平均 
发 动机 排 量 的 变化 过 程 ， 线 1、 线 2、 线 3 分 别 代表 了 美国 、 日 本 和 欧洲 生产 的 汽车 的 平均 发 
动机 排 量 的 线性 走势 。 


脱产 国家 
网 
: 
i 
| 
4 
AL 
马力 (下) 
图 19-33 线 图 示例 


19.3.1 ” 线 图 的 类 型 


线 图 利用 线条 的 延伸 和 波动 ， 来 反映 连续 性 变量 的 变化 趋势 。 线 图 可 以 是 直线 图 , 也 可 以 
是 折线 图 ， 适 用 于 连续 性 资料 。 描 述 非 连续 性 的 资料 一 般 不 使 用 线 〈 形 ) 图 ， 而 使 用 条 形 图 或 
直线 图 。 线 图 分 为 3 种 类 型 简单 线 图 、 多 重 线 图 和 垂直 线 图 (下降 线 图 ) 。 


。 简单 线 图 : 用 一 条 折线 表示 某 个 现象 的 变化 趋势 。 
。 多 重 线 图 : 用 多 条 折线 表示 各 种 现象 的 变化 趋势 。 
。 垂直 线 图 或 下 降 线 图 : 用 于 反映 某 些 现象 。 


像 条 形 图 一 样 ， 线 图 的 每 种 图 形 类 型 分 别 对 应 3 种 不 同 的 模式 : 个 案 分 组 模式 、 变 量 分 组 
模式 和 个 案 模式 。3 种 模式 的 概念 与 条 形 图 中 一 致 ， 在 此 不 再 著述 。 

SPSS 24.0 共 提 供 了 9 种 不 同 的 线 图 供用 户 选 择 ， 最 大 化 地 满足 了 用 户 的 个 性 化 和 研究 需求 。 
本 节 实 验 所 使 用 的 数据 文件 依然 是 “19-1” 数 据 文件 。 


19.3.2 ”绘制 简单 线 图 


如 果 需 要 用 图 形 来 描述 马力 和 发 动机 排 量 之 间 的 关系 形式 ,我 们 可 以 建立 二 者 之 间 的 线形 
图 。 下 面 将 详细 介绍 如 何 利 用 图 表 构 建 器 绘制 简单 线 图 。 
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1) 打开 “19-1” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 , 在 菜单 栏 中 选择 “图 形 ” 
| “图表 构建 器 ”命令 ， 打 开 “ 图 表 构 建 器 ”对 话 框 。 

2) 在 “选择 范围 ”列表 框 中 选择 “折线 图 ”， 然 后 从 右 侧 显示 的 直观 表示 中 双击 简单 条 
形 图 直观 表示 之 成 将 其 选择 拖 入 画布 中 。 将 变量 “马力 ”和 “发 动机 排 量 ” 分 别 拖 入 横 轴 和 
纵 轴 变 量 放置 区 内 ， 如 图 19-34 所 示 。 

3) 同 条 形 图 一 样 ， 用 户 可 以 在 “元 素 属性 ”对 话 框 中 对 所 有 元 素 属性 可 选项 进行 设置 ， 
选择 “平均 值 ”作为 摘要 统计 量 ; 在 “标题 /脚注 ”选项 卡 中 选中 “标题 1” 复 选 框 ， 并 在 “元 
素 属性 ”对 话 框 的 “内 容 ” 文 本 框 中 输入 “马力 和 发 动机 排 量 关 系 线形 图 ”作为 输出 简单 线性 
图 的 标题 。 设 置 完 毕 后 ， 单 击 “ 应 用 ”按钮 使 设置 生效 。 

4) 输出 图 形 。 

所 有 设置 结束 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 中 
输出 图 形 ， 结 果 如 图 19-35 所 示 。 


CE 
Ei 超 交 规划 锡 忆 示 名 灼 理 
本 加 位 汽油 行驶 的 砚 
护 冯 机 他 ( 立 方 丙 
车 里 ( 确 ) 区 | 和 = 
下 (TS \ 
思 闻 | \ ] \ 
oowece2 | \ ' 马力 和 发 动机 排 生 关系 线形 图 
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| 双 负 图 
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图 19-34 “图 表 构建 器 ”对 话 框 图 19-35 简单 线 图 输出 结果 


由 输出 结果 可 知 ,尽管 随 着 汽车 马力 的 增 大 , 发 动机 排 量 的 变动 幅度 较 大 , 但 仍 可 以 大 体 
推断 ， 马 力 与 发 动机 排 量 间 存 在 较 强 的 正 向 关系 。 


19.3.3 ”绘制 多 重 线 图 

多 重 线 图 在 一 个 图 中 显示 多 条 趋势 图 , 它 需要 指定 一 个 分 线 变 量 , 对 其 每 个 取 值 分 别 在 图 
中 作 一 条 曲线 ， 以 便 观察 和 比较 不 同类 别 的 样本 的 变化 趋势 。 

本 小 节 继 续 通过 “19-1” 数 据 文 件 ， 介 绍 如 何 使 用 图 形 画 板 模板 选择 器 绘制 多 重 线形 图 ， 
以 查看 不 同 国家 所 产 汽车 的 马力 和 发 动机 排 量 之 间 的 关系 。 


1) 打开 “19-1” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ,在 菜单 栏 中 选择 “图 形 ” 
| “图 形 画板 模板 选择 器 ”命令 ， 打 开 “ 图 形 画 板 模 板 选择 器 ”对 话 框 。 
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2) 从 变量 列表 框 中 选择 “马力 ”和 “发 动机 排 量 ”两 个 变量 ， 从 中 选择 线 图 直观 表示 加 ]， 
从 “摘要 ”下 拉 列 表 框 中 选择 “均值 ”作为 输出 摘要 统计 量 。 

3) 单 击 “ 图 形 画板 模板 选择 器 ”对 话 框 中 的 “详细 ”选项 卡 ， 从 “可 选 审美 原则 ”选项 
组 的 “色彩 ”下 拉 列 表 框 中 选择 “ 原 产 国 家 ”。 

4) 在 “标题 ”选项 卡 中 为 图 表 添 加 “不 同 国家 马力 和 引擎 关系 多 重 线形 图 ”标题 ， 其 他 
均 采 用 默认 设置 。 

5) 所 有 设置 结束 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 
口中 输出 图 形 ， 如 图 19-36 所 示 。 


不 同 国家 马力 和 引擎 关系 多 重 线形 图 
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19-36 多重 线 图 输出 结果 


19.3.4 ”垂直 线 图 的 绘制 


垂直 线 图 与 多 重 线 图 反映 的 内 容 类 似 , 差别 只 是 表现 的 形式 不 同 而 已 。 垂直 线 图 可 以 反映 
某 些 现象 在 同一 时 期 的 差距 或 各 种 数据 在 各 分 类 中 所 占 的 比例 。 本 小 节 仍 以 “19-1” 数 据 文件 
为 例 简要 介绍 垂直 线 图 的 绘制 方法 。 


1) 打开 “19-1” 数 据 文 件 ， 进 入 SPSS Statistics 数 据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 
”|“ 旧 对 话 框 ”|“ 折 线 图 ”命令 ， 打 开 “ 折 线 图 ”对 话 框 ， 选 择 “ 垂 线 ” 直 观 表 示 ， 在 “图 
表 中 的 数据 为 ”选项 组 中 选中 “个 案 组 摘要 ” 单 选 按钮 。 

2) 单 击 “ 定 义 ” 按 钮 ， 弹 出 “定义 垂 线 图 : 个 案 组 摘要 ”对 话 框 。 变 量 的 设置 与 多 重 线 
图 的 旧 对 话 框 设 置 一 样 ， 差 别 只 是 将 “ 原 产 国家 ” 选 入 “定义 点 ”列表 框 中 。 

3) 在 “标题 ”对 话 框 的 “标题 1” 文 本 框 中 输入 “各 国 不 同 汽缸 数 汽车 发 动机 排 量 均值 图 
”作为 输出 图 表 标 题 ， 其 他 均 采 用 默认 设置 。 

4) 所 有 设置 完毕 后 ， 单 击 “ 定 义 垂 线 图 : 个 案 组 摘要 ”对 话 框 中 的 “确定 ”按钮 ， 即 可 
在 SPSS Statistics 查看 器 中 窗口 输出 图 形 ， 结 果 如 图 19-37 所 示 。 
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各 国 不 同 汽缸 数 汽车 发 动机 排 量 均值 图 
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19-37 ”垂直 线 图 输出 结果 


19.4 面 积 


面积 图 与 线形 图 反映 的 信息 相似 ,经 常用 来 描述 某 个 汇总 变量 随时 间或 其 他 变量 的 变化 过 
程 。 面积 图 通过 面积 的 变化 描绘 连续 型 变量 的 分 布 形状 或 变化 趋势 , 从 直观 上 看 ， 它 相当 于 在 
线形 图 中 用 某 种 颜色 填充 线条 和 横 轴 之 间 的 面积 区 域 。 

如 图 19-38 所 示 为 堆积 面积 图 的 示例 ， 该 图 用 不 同 的 颜色 给 出 了 不 同性 别 员工 当前 薪金 
随 不 同 教育 水 平 的 变化 趋势 , 面积 1 和 面积 2 分 别 代表 女 员 工 和 男 员 工 不 同 教育 水 平 的 当前 
薪金 走势 。 
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19-38 面积 图 示例 
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19.4.1 面积 图 的 类 型 


因为 面积 图 较 线形 图 更 厚实 ， 给 人 印象 更 深刻 ， 所 以 广泛 应 用 于 各 领域 。SPSS 24.0 提供 
了 两 种 基本 面积 图 类 型 : 简单 面积 图 和 堆积 面积 图 。 

类 似 于 简单 线形 图 , 简单 面积 图 是 用 面积 的 变化 表示 某 一 现象 变动 的 趋势 ; 堆积 面积 图 又 
称 层 倒 面积 图 , 使 用 不 同 颜色 面积 表示 两 种 或 多 种 现象 变化 的 趋势 。 两 种 基本 面积 图 类 型 又 分 
别 包 含 3 种 模式 : 个 案 组 模式 、 变 量 分 组 模式 和 个 案 模 式 ，3 种 模式 的 定义 也 与 前 面 章节 所 描 
述 的 一 致 。 因 此 ，SPSS 24.0 提供 了 6 种 类 型 的 面积 图 供用 户 选 择 。 


19.4.2 简单 面积 图 绘制 的 实验 操作 


本 小 节 使 用 “19-2” 数 据 文件 介绍 简单 面积 图 的 绘制 过 程 。“19-2” 数 据 文件 来 源 于 SPSS 
24.0 自 带 的 “Employee data.sav” 数 据 文件 ， 该 虚拟 数据 文件 涉及 公司 所 雇用 员工 的 员工 代码 、 
性 别 、 教 育 水 平 、 雇 用 类 别 及 薪金 情况 等 。 


1. 实验 数据 描述 

打开 “19-2” 数 据 文件 ， 在 SPSS Statistics 数据 编辑 器 窗口 中 可 以 看 到 “19-2” 数 据 文件 
中 的 变量 描述 ， 如 图 19-39 所 示 。 

2. 简单 面积 图 的 SPSS 操作 过 程 


与 条 形 图 和 线形 图 的 绘制 一 样 ，SPSS 24.0 提供 的 可 以 用 于 绘制 面积 图 的 程序 也 有 4 种 。 
本 节 仅 介绍 如 何 使 用 图 形 画 板 模板 选择 器 绘制 简单 面积 图 ,用 户 可 以 参照 前 文 自主 学 习 简单 面 
积 图 的 其 他 绘制 方法 。 


者 党 用 法 计 图 乡 制 2 sav 用 名 入 1] - 16M SPSS Statistics 数 户 纺 源 各 一 [=] x 
EE 


ED EECTT 标 竺 ES | RE 
0 无 性 右 依 村 度 、Y 钉 入 
芭 划 
无 
| 教育 水 平 ”数字 人 .0 ( 藤 少 
| 尾 仙 类 别 数字 全 ,0 ( 误 少 . 
上 | 当前 医 金 美元 5 [50. 其 少 ]- 
起 下 医 金 美元 {50, 缺少 ) 
雇 倩 时间” 教 字 大 但 时 间 〈- 加, 某 少 } 
经 验 数字 经 验 〈 以 月 各, 其 少 } 
少数 民族 ”数字 少数 民族 分 关 人 0, 至 } 


攻 左 更 名 X 输入 
3 洗 右 六 标 认输 入 
EE LLANTIN 
一 右 哺 有 怀 输入 
台 石 态 标 度 S 得 入 
当 石 态 标 度 入 入 
EE 


溉 石 省 度 新入 
疆 右 媒 有 序 \ 新 入 


制 国 国 国 后 国 图 国 国 国 


| BM SPSS Statistcs 处 理 程序 斌 络 | | |Unicode ON | 
图 19-39 “19-2” 数 据 文 件 变量 描述 图 


1) 打开 “19-2” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 ” 
|“ 图 形 画 板 模板 选择 器 ”命令 ， 打 开 “ 图 形 画 板 模板 选择 器 ”对 话 框 。 
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2) 从 变量 列表 框 中 选择 “教育 水 平 ” 和 “当前 薪金 ”两 个 变量 ， 从 中 选择 面积 图 直观 表 
示 团 ， 在 “摘要 ”下 拉 列 表 框 中 选择 “均值 ”作为 摘要 统计 量 。 

3) 在 “标题 ”选项 卡 中 为 图 标 添 加 “教育 水 平和 薪金 关系 面积 图 ”标题 ， 其 他 均 采 用 默 
认 设置 。 

4) 所 有 设置 完毕 后 , 单 击 “ 图 形 画 板 模板 选择 器 ”对 话 框 中 的 “确定 ”按钮 , 即 可 在 SPSS 
Statistics 查看 器 窗口 中 输出 如 图 19-40 所 示 的 图 形 。 


教育 水 平和 薪金 关系 面积 图 


8 年 ”12 年 14 年 15 年 16 年 17 年 18 年 19 年 20 年 21 征 
教育 水 平 (年 ) 


图 19-40 简单 面积 图 输出 结果 
19.4.3 ”堆积 面积 图 绘制 的 SPSs 操作 


本 小 节 仅 简单 介绍 如 何 使 用 图 表 构建 器 绘制 堆积 面积 图 ,用 户 可 以 参照 前 文 自主 学 习 堆 积 
面积 图 的 其 他 绘制 方法 。 

我 们 仍 将 利用 “19-2” 数 据 文件 得 到 不 同性 别 员工 的 教育 水 平和 年 薪 关 系 的 堆积 面积 图 ， 
其 操作 过 程 具体 如 下 : 


1) 打开 “19-2” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 ” 
|“ 图 表 构建 器 ”命令 ， 打 开 “ 图 表 构 建 器 ”对 话 框 。 

2) 在 “选择 范围 ”列表 框 中 选择 “面积 图 ”， 然 后 从 右 侧 显示 的 直观 表示 中 双击 多 重 线 
图 直观 表示 内 | 或 将 其 选择 拖 入 画布 中 。 从 变量 列表 框 中 选择 “教育 水 平 ”变量 并 拖 至 X 轴 变 
量 放置 区 ， 选 择 “当前 薪金 ”变量 并 拖 至 Y 轴 变 量 放 置 区 ， 将 “性 别 ” 拖 入 “堆栈 : 设置 颜 
色 ” 变 量 放置 区 。 

3) 所 有 图 形 元 素 的 属性 均 可 以 在 “元 素 属性 ”对 话 框 中 进行 设置 ， 设 置 方法 与 前 面 所 述 
相同 。 在 “元 素 属性 ”对 话 框 中 选择 “编辑 以 下 对 象 的 属性 ”列表 框 中 的 “面积 图 1”， 选 择 
“统计 ”下 拉 列 表 框 中 的 “平均 值 ”选项 ， 设 置 完毕 后 ， 单 击 “ 应 用 ”按钮 使 设置 生效 。 

4) 所 有 设置 结束 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 
口中 输出 图 形 ， 结 果 如 图 19-41 所 示 。 
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性 别 


了 徐 江 中 记过 飞 


8 年 12 年 14 年 15 入 16 年 17 年 18 年 19 年 20 年 21 征 


教育 水 平 〈 年 ) 
19-41 堆积 面积 图 输出 结果 


由 图 可 以 看 出 ， 同 性别 前 提 下 ， 受 教育 年 限 与 当前 薪金 平均 值 基本 成 正 向 关系 ; 在 受 教育 
年 限 相同 的 前 提 下 ， 女 员工 当前 薪金 平均 值 明 显 低 于 男 员工 。 


19.5 饼 图 


饼 图 又 称 为 饼 形 图 或 圆 形 图 ， 通 常用 来 表示 整体 的 构成 部 分 及 各 部 分 之 间 的 比例 关系 。 
如 图 19-42 所 示 为 饼 图 的 示例 图 ， 该 图 用 不 同 的 颜色 将 饼 图 分 为 三 部 分 ， 用 扇形 1、2、3 
代表 了 职员 、 保 管 员 和 经 理 在 员工 总 数 中 的 百分比 。 


庚 仙 类 别 


国 吕 全 
国保 答 刀 
EI 


19-42 ” 饼 图 示例 
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饼 图 用 同一 个 圆 形 表示 不 同 部 分 的 比例 情况 , 其中, 整个 圆 的 面积 表示 整体 ， 圆 中 的 扇形 
部 分 是 按 构 成 整体 的 各 个 部 分 在 整体 中 所 占 比 例 的 大 小 切割 而 成 的 。 饼 图 可 以 直观 地 反映 各 部 
分 与 整体 之 间 的 关系 及 各 部 分 之 间 的 关系 。 

SPSS 24.0 提供 了 3 种 不 同 的 饼 图 模式 : 个 案 分 组 模式 、 变 量 分 组 模式 和 个 案 模式 。 绘 制 
人 饼 图 的 程序 同样 有 4 种 : 图 表 构 建 器 、 图 形 画 板 模板 选择 器 、 旧 对 话 框 程序 和 互动 程序 。 


19.5.2 绘制 饼 图 的 SPSS 实验 操作 


我 们 将 继续 结合 “19-2” 数 据 文件 来 介绍 饼 图 的 绘制 过 程 ，“19-2” 数 据 文件 的 变量 描述 
在 前 面 已 经 给 出 , 在 此 不 再 袭 述 。 本 节 仅 介绍 如 何 使 用 图 表 构建 器 绘制 饼 图 ， 其 他 3 种 方法 用 
户 可 以 参照 前 文 自主 学 习 。 


1) 打开 “19-2” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 ” 
|“ 图 表 构建 器 ”命令 ， 打 开 “ 图 表 构 建 器 ”对 话 框 。 

2) 在 “选择 范围 ”列表 框 中 选择 “ 饼 图 / 极 坐标 图 ”， 然 后 从 右 侧 显示 的 直观 表示 中 双击 
饼 图 直观 表示 国 成 将 其 选择 拖 入 画布 中 ， 将 变量 “教育 水 平 ” 拖 入 横 轴 放置 区 内 。 

3) 与 其 他 图 形 的 绘制 一 样 ， 可 以 在 “元 素 属 性 ”对 话 框 中 对 所 有 元 素 属 性 可 选项 进行 设 
置 。 选 择 “ 计 数 ” 作 为 摘要 统计 量 ， 单 击 “ 应 用 ”按钮 使 设置 生效 。 在 “标题 /脚注 ”选项 卡 
中 选中 “标题 1 ” 复 选 框 ， 并 在 “元 素 属性 ”对 话 框 的 “内 容 ” 文 本 框 中 输入 “教育 水 平 饼 状 
图 ”作为 输出 饼 状 图 的 标题 ， 设 置 完毕 后 ， 单 击 “ 应 用 ”按钮 。 

4) 所 有 设置 结束 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 
口中 输出 图 形 ， 结 果 如 图 19-43 所 示 。 


教育 水 平 饼 状 图 
教育 水 平 〈 征 
国 8 咎 


19-43 ” 饼 状 图 输出 结果 


由 该 饼 状 图 可 以 明显 看 出 , 所 有 员工 中 , 受过 12 年 教育 的 人 数 最 多 , 其 次 是 接受 15 年 教 
育 的 ， 受 教育 年 限 在 16 年 内 的 员工 占 总 员工 人 数 的 绝 大 多 数 。 
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19.6 直方 图 


直方 图 是 用 一 种 无 间隔 的 长 短 直 条 , 表示 连续 型 变量 取 值 分 布 特点 的 统计 图 形 , 各 直 条 的 
面积 表示 各 组 段 的 频率 ， 各 矩形 面积 的 总 和 为 总 频率 。 

没有 绘制 正 态 曲线 的 直方 图 与 条 形 图 很 相似 , 它们 的 区 别 是 , 直方 图 的 条 带 长 度 与 宽度 是 
有 意义 的 ， 条 形 图 则 没有 ， 直 方 图 的 意义 与 面积 图 相似 。 

下 面 将 简单 介绍 如 何 使 用 图 形 画 板 模板 选择 器 绘制 直方 图 ,用 户 可 以 参照 前 文 自主 学 习 使 
用 其 他 方法 绘制 直方 图 。 这 里 使 用 的 依然 是 “19-1” 数 据 文件 ， 该 数据 文件 的 变量 描述 在 19.2 
节 中 已 给 出 ， 在 此 不 再 獒 述 。 


1) 打开 “19-1” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 ” 
| “图 形 画 板 模板 选择 器 ”命令 ， 打 开 “ 图 形 画 板 模板 选择 器 ”对 话 框 。 

2) 从 变量 列表 框 中 选择 “mpg” 变 量 ， 从 右 侧 可 用 图 形 类 型 中 选择 “ 带 有 正 态 分 布 的 直 
方 图 ” 加。 

3) 在 “标题 ”选项 卡 中 为 图 表 添 加 “每 加 仑 汽油 行驶 的 英里 数 直 方 图 ”标题 ， 其 他 均 采 
用 默认 设置 。 

4) 所 有 设置 完毕 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 
口中 输出 如 图 19-44 所 示 的 图 形 。 


每 加 仑 汽油 行驶 的 英里 数 直 方 图 


2 0 
每 加 仑 汽油 行驶 的 英里 数 


图 19-44 直方 图 输出 结果 
从 图 中 可 以 看 出 ， 每 加 仑 汽油 行驶 的 英里 数 频率 分 布 不 完全 符合 正 态 分 布 。 


19.7 散 点 图 


散 点 图 是 以 点 的 分 布 情况 反映 变量 之 间 相 互 关系 的 一 种 统计 图 形 。 散 点 图 适用 于 描绘 测量 
数据 的 原始 分 布 状况 , 用 户 可 以 通过 点 的 位 置 判 断 观测 值 的 高 低 、 大小、 变动 趋势 或 变化 范围 。 
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图 19-45 所 示 为 散 点 图 的 示例 , 该 图 用 点 1 和 点 2 分 别 表示 非 少数 民族 和 少数 民族 不 同 雇 
用 类 别 员 工 的 起 始 薪金 。 


少数 民族 分 类 


OO 
we 8 
$60,000"] o 
和 
| om 3 | 
(美元 ) 
- | 
3 
$20,000-] 
: 
$0 T T i 
雇佣 类 曾 


19-45 ” 散 点 图 示例 


19.7.1 散 点 图 的 类 型 


SPSS 24.0 提供 了 散 点 图 的 5 种 基本 类 型 , 分别 为 简单 散 点 图 、 重 受 散 点 图 、 和 矩阵 散 点 图 、 
三 维 散 点 图 和 简单 圆 点 图 。 


(1) 简单 散 点 图 : 用 于 对 照 某 个 变量 绘制 另 一 个 变量 或 在 一 个 标记 变量 定义 的 类 别 中 绘 
制 两 个 变量 。 

(2) 重 受 散 点 图 : 用 于 绘制 两 个 或 多 个 y-x 变量 对 ， 每 对 都 采用 不 同 标记 来 表示 。 

(3) 矩阵 散 点 图 : 行 和 列 数 与 所 选 和 矩阵 变量 个 数 相等 ， 所 有 可 能 变量 组 合 被 显示 〈 变 量 
1 对 比 变量 2) 和 翻转 (变量 2 对 比 变量 1) 。 

(4) 三 维 散 点 图 : 用 于 在 三 维 空间 内 绘制 3 个 变量 。 

(5) 简单 圆 点 图 : 用 于 为 某 个 数值 变量 绘制 各 个 观察 值 。 


与 其 他 图 形 的 绘制 一 样 ，SPSS 24.0 同样 提供 了 图 表 构 建 器 、 图 形 画 板 模板 选择 器 、 旧 对 
话 框 程序 和 互动 程序 4 种 方法 绘制 散 点 图 。 由 于 简单 圆 点 图 的 绘制 较为 简单 , 接 下 来 我 们 将 使 
用 “19-2” 数 据 文件 ， 说 明 SPSS 24.0 绘制 除 简单 圆 点 图 外 的 4 种 散 点 图 的 具体 操作 方法 。 


19.7.2 ”简单 散 点 图 绘制 的 SPSS 操作 


本 节 仅 介绍 如 何 使 用 图 形 画板 模板 选择 器 绘制 简单 散 点 图 ,用 户 可 以 自主 参照 前 文学 习 其 
他 绘制 方法 。 


1) 打开 “19-2” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ,在 菜单 栏 中 选择 “图 形 ” 
|“ 图 形 画 板 模板 选择 器 ”命令 ， 打 开 “ 图 形 画 板 模板 选择 器 ”对 话 框 。 
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2) 从 变量 列表 框 中 选择 “起 始 薪金 ”和 “当前 薪金 ”变量 ， 从 右 侧 可 用 图 形 类 型 中 选择 
“ 散 点 图 ” 回 。 

3) 在 “标题 ”选项 卡 中 为 图 表 添 加 “起 始 薪金 与 当前 薪金 简单 散 点 图 ”标题 ， 其 他 均 采 
用 默认 设置 。 

4) 所 有 设置 完毕 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 
口中 输出 如 图 19-46 所 示 的 图 形 。 


起 始 薪金 与 当前 薪金 简单 散 点 图 


图 19-46 简单 散 点 图 输出 结果 
19.7.3 ”重生 散 点 图 绘制 的 SPSS 操作 


重合 散 点 图 的 绘制 主要 通过 旧 对 话 框 程序 实现 ， 现 结合 “19-2” 数 据 文件 简单 说 明 重 县 散 
点 图 的 绘制 过 程 。 


1) 打开 “19-2” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 ” 
1“ 旧 对 话 框 ”|“ 散 点 /点 状 ”命令 ， 打开“ 散 点 图 /点 图 ”对 话 框 ， 对 话 框 中 显示 了 5 种 可 用 的 
散 点 图 类 型 ， 如 图 19-47 所 示 。 


蛤 艇 吉 图 /点 图 x 


nm 转 “= be 
[一 国光 


EE) ma (wm) 
19-47 “ 散 点 图 /点 图 ”对 话 框 
因为 我 们 想 要 输出 的 是 重合 散 点 图 ， 因 此 这 里 选中 “ 重 短 散 点 图 ”直观 表示 。 


2) 单 击 “ 定 义 ”按钮 ， 弹 出 “重合 散 点 图 ”对 话 框 ， 在 此 指定 变量 及 其 他 图 形 元 素 。 从 
变量 列表 框 中 将 “当前 薪金 ”变量 选 入 变量 配对 1 和 2 的 Y 变量 放置 区 ， 将 “教育 水 平 ” 和 
“雇用 类 别 ” 分 别 拖 入 变量 配对 1 和 2 的 和 变量 放置 区 。 打 开 “ 标 题 ”对 话 框 ， 将 “堆积 散 
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点 图 示例 ”输入 “第 1 行 ” 文 本 框 中 ， 单 击 “ 继 续 ” 按 钮 保存 设置 返回 到 主 对 话 框 中 ， 设 置 结 
果 如 图 19-48 所 示 。 


3) 所 有 设置 完毕 后 , 单 击 “ 重 又 散 点 图 ”对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 
查看 器 窗口 中 输出 图 形 ， 结 果 如 图 19-49 所 示 。 
CPE 
PRETTSCT 人 Xt 莱 积 散 点 图 示例 
总 性 别人 性 别 | | 了 3 
be 国 | 人 前 国 Ea 
从 当前 基金 当前 地] 国 
ri A 2 > 
he 国 一 he 上 [二 
面板 庆 分 依据 :一 一 一 一 一 一 一 一 一 一 一 0 S 9 
和 。 o"Bo 
国 sel. 
本 更 可 o 8 388" 
加 | | 
CE EE | | Bas 
『「 模 板 
站 要 使用 的 E 来 措 定 其 的 来 源 (U): 
Lae ER La mi 站 可 
19-48 “ 重 侄 散 点 图 ”对 话 框 19-49 ”重合 散 点 图 输出 结果 
由 图 19-49 可 知 ， 不 同 职 位 、 不 同 受 教育 年 限 的 员工 当前 薪金 是 有 较为 明显 差异 的 。 


19.7.4 ”矩阵 散 点 图 绘制 的 SPSS 操作 


SPSS 24.0 提供 的 可 以 绘制 矩阵 散 点 图 的 方法 主要 有 图 表 构 建 器 和 旧 对 话 框 程序 两 种 。 下 
面 将 结合 “19-2” 数 据 文件 简单 介绍 利用 图 表 构建 器 绘制 矩阵 散 点 图 ， 用户 可 参照 前 文学 习 如 
何 使 用 旧 对 话 框 绘制 矩阵 散 点 图 。 


1) 打开 “19-2” 数 据 文件 , 进入 SPSS Statistics 数据 编辑 器 窗口 , 在 菜单 栏 中 依次 选择 “图 
形 ”|“ 图 表 构 建 器 ”命令 ， 打开“ 图 表 构 建 器 ”对 话 框 。 

2) 在 “选择 范围 ”列表 框 中 选择 “ 散 点 图 /点 图 ”， 然 后 从 右 侧 显示 的 直观 表示 中 双击 散 
点 图 矩阵 直观 表示 对] 或 将 其 选择 拖 入 画布 中 。 将 变量 “当前 薪金 ” “雇佣 时 间 ” 和 “经 验 ” 
拖 入 散 点 矩阵 变量 放置 区 内 ， 如 图 19-50 所 示 。 

3) 与 绘制 其 他 图 形 一 样 ， 用 户 可 以 在 “元 素 属性 ”对 话 框 中 对 所 有 元 素 属性 可 选项 进行 
设置 。 在 “标题 /脚注 ”选项 卡 中 选中 “标题 1” 复 选 框 ， 并 在 “元 素 属性 ”对 话 框 的 “内 容 ” 
文本 框 中 输入 “ 甜 阵 散 点 图 示例 ”作为 输出 矩阵 散 点 图 的 标题 ,设置 完毕 后 ， 单 击 “ 应 用 ” 按 
钮 使 设置 生效 。 

4) 所 有 设置 结束 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 
口中 输出 图 形 ， 结 果 如 图 19-51 所 示 。 


由 图 可 以 看 出 ，3 个 变量 两 两 之 间 不 存在 特别 明显 的 线性 关系 。 
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图 19-50 “图 表 构建 器 ”对 话 框 图 19-51 和 拢 阵 散 点 图 输出 结果 


经 验 《 以 月 计 》 


雇佣 时 间 《〈 电 月 
直 ) 


三 维 散 点 图 的 绘制 过 程 与 简单 散 点 图 的 绘制 过 程 基本 一 致 ， 只 是 增加 了 一 个 乙 轴 。 下 面 将 
结合 “19-2” 数 据 文件 简单 介绍 图 表 构 建 器 绘制 三 维 散 点 图 。 


1) 打开 “19-2” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 ” 
1“ 图 表 构 建 器 ”命令 ， 打 开 “ 图 表 构 建 器 ”对 话 框 。 

2) 在 “选择 范围 ”列表 框 中 选择 “ 散 点 图 /点 图 ”， 然 后 从 右 侧 显示 的 直观 表示 中 双击 简 
单 3-D 散 点 图 直观 表示 留成 将 其 选择 拖 入 画布 中 。 将 变量 “起 始 薪金 ”“ 当 前 薪金 ”及 “ 教 
育 水 平 ” 分 别 拖 入 和 X 轴 变量 放置 区 、Y 轴 变 量 放置 区 及 乙 轴 变量 放置 区 内 ， 如 图 19-52 所 示 。 


EW te 


19-52 “图 表 构 建 器 ”对 话 框 
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3) 在 “标题 /脚注 ”选项 卡 中 选中 “标题 1” 复 选 框 ， 并 在 “元 素 属性 ”对 话 框 的 “内 容 ” 
文本 框 中 输入 “三 维 散 点 图 示例 ”作为 输出 三 维 散 点 图 的 标题 ， 设置 完毕 后 ， 单 击 “ 应 用 ” 按 
钮 使 设置 生效 。 

4) 所 有 设置 结束 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 
口中 输出 图 形 ， 结 果 如 图 19-53 所 示 。 


三 维 散 点 图 示例 


19-53 三维 散 点 图 输出 结果 


19.8 箱 图 


箱 图 又 称 箱 丝 图 ， 是 一 种 描述 数据 分 布 的 统计 图 ， 可 用 于 表现 定量 变量 的 5 个 百 分 位 点 ， 
即 2.5%、25%、50%、75% 和 “97.5% 分 位 数 。 由 25% 分 位 数 ~75% 分 位 数 构成 图 形 的 箱 ， 由 
2.5%~25% 和 75%~97.5% 构 成 图 形 的 两 条 “ 丝 ”。 

如 图 19-54 所 示 为 一 个 箱 图 的 示例 ， 该 图 中 丝 1~ 丝 5 分 别 代表 不 同 原 产 国家 汽车 重量 的 
2.5%、25%、50%、75% 和 97.5% 分 位 数 ， 箱 体 部 分 由 丝 2~ 丝 4 的 中 间 部 分 构成 。 


19-54 ” 箱 图 示例 
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19.8.1 箱 图 的 类 型 


SPSS 24.0 为 用 户 提供 了 两 种 箱 图 类 型 : 简单 箱 图 和 分 类 箱 图 。 简 单 箱 图 用 于 描述 单个 变 
量 数 据 的 分 布 ; 分 类 箱 图 又 称 复式 箱 图 , 用 于 描述 某 个 变量 关于 另 一 个 变量 数据 的 分 布 。 每 种 
基本 图 形 类 型 又 包括 两 种 模式 : 个 案 组 模式 和 变量 分 组 模式 。 两 种 模式 的 含义 与 前 面 章节 所 述 
一 致 ， 在 此 不 再 歼 述 。 


19.8.2 ”简单 箱 图 绘制 的 SPSS 操作 


本 节 将 继续 使 用 “19-1” 数 据 文件 介绍 如 何 使 用 图 形 画板 模板 选择 器 绘制 简单 箱 图 。 


1) 打开 “19-1” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 ” 
“图 形 画 板 模板 选择 器 ”命令 ,打开 “图 形 画 
板 模板 选择 器 ”对 话 框 。 

2) 从 变量 列表 框 中 选择 “重量 ”和 “ 原 产 
国家 ”变量 ， 从 右 侧 可 用 图 形 类 型 中 选择 “ 箱 
图 ” 国 。 

3) 在 “标题 ”选项 卡 中 为 图 表 添 加 “简单 
箱 图 示例 ”标题 ， 其 他 均 采 用 默认 设置 。 

4) 所 有 设置 完毕 后 , 单 击 主 对 话 框 中 的 “ 确 
定 ” 按 钮 ， 即 可 在 SPSS Statistics 查看 器 窗口 
中 ， 输 出 如 图 19-55 所 示 的 图 形 。 


由 输出 图 可 以 明显 看 出 ， 美 国产 的 汽车 重 
量 要 明显 高 于 欧洲 和 日 本 产 的 汽车 重量 。 19-55 ”简单 箱 图 输出 结果 


19.8.3 ”分 类 箱 图 绘制 的 SPSS 操作 


分 类 箱 图 或 复式 箱 图 的 绘制 过 程 与 简单 箱 图 的 绘制 基本 相同 ,只 需要 在 原 有 变量 基础 上 添 
加 一 个 分 类 变量 即 可 。 下 面 将 继续 使 用 “19-1” 数 据 文件 介绍 如 何 使 用 图 表 构 建 器 绘制 分 类 
箱 图 。 


1) 打开 “19-1” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ,在 菜单 栏 中 选择 “图 形 ” 
|“ 图 表 构 建 器 ”命令 ， 打 开 “ 图 表 构 建 器 ”对 话 框 。 

2) 在 “选择 范围 ”列表 框 中 选择 “ 箱 图 ”， 然 后 从 右 侧 显示 的 直观 表示 中 双击 分 类 箱 图 
直观 表示 项 或 将 其 选择 拖 入 画布 中 。 将 变量 “ 原 产 国家 ” 拖 入 横 轴 变量 放置 区 内 ， 将 变量 “车 
辆 重量 ” 拖 入 纵 轴 变 量 放置 区 内 ， 将 “汽缸 数 ” 拖 入 “和 轴 上 的 聚 类 : 设置 颜色 ”变量 放置 区 
内 ， 如 图 19-56 所 示 。 

3) 在 “标题 /脚注 ”选项 卡 中 选中 “标题 1” 复 选 框 ， 并 在 “元 素 属 性 ”对 话 框 的 “内 容 ” 
文本 框 中 输入 “复式 箱 图 示例 ”作为 输出 分 类 箱 图 的 标题 ， 设 置 完毕 后 ， 单 击 “ 应 用 ”按钮 使 
设置 生效 。 

4) 所 有 设置 结束 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 
口中 输出 图 形 ， 结 果 如 图 19-57 所 示 。 


《如 ) 部 汉语 性 
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复式 箱 图 示例 


(于) 种 入 攻 


天国 Ca 日 本 


LE Jaahe EE 原 产 国家 
图 19-56 “图 表 构建 器 ”对 话 框 图 19-57 复式 箱 图 输出 结果 


19.9 ”误差 条 图 


误差 条 图 是 一 种 用 于 描述 平均 值 、 标准 差 、 标 准 误 和 总 体 平均 值 的 置信 区 间 等 指标 的 统计 
图 形 。 

如 图 19-58 所 示 为 误差 条 图 , 该 示例 图 给 出 了 男女 员工 当前 薪金 的 均值 及 95% 置 信 度 下 当 
前 薪金 的 置信 区 间 。 线 1 和 线 2 分 别 代表 置信 区 间 的 最 小 值 和 最 大 值 ， 点 给 出 了 当前 薪金 的 
均值 。 


性 曾 


图 19-58 误差 条 图 示例 
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19.9.1 误差 条 图 的 类 型 


误差 条 图 是 一 种 描述 总 体 离散 情况 分 布 的 统计 图 形 , 可 以 描述 正 态 分 布 整体 的 平均 值 、 标 
准 差 及 其 置信 区 间 等 , 利用 误差 条 图 可 以 观测 样本 的 离散 程度 。 误差 条 图 还 可 以 伴随 着 其 他 图 
形 的 建立 过 程 而 输出 ， 如 条 形 图 、 线 图 等 。 

误差 条 图 包括 两 种 基本 类 型 , 即 简单 误差 条 图 和 复式 误差 条 图 。 每 种 图 形 类 型 同时 包含 个 
案 组 和 变量 组 两 种 模式 ，SPSS 24.0 共 提 供 了 19 种 误差 条 图 形式 供用 户 选择 。 


19.9.2 ”简单 误差 条 图 绘制 的 SPSS 操作 


SPSS 24.0 中 可 用 于 绘制 误差 条 图 主要 有 旧 对 话 框 程序 和 互动 程序 两 种 方法 。 下 面 将 结合 
“19-2” 数 据 文件 介绍 如 何 使 用 旧 对 话 框 绘制 简单 误差 条 图 ， 用 户 可 自主 学 习 互 动 程序 的 使 用 。 


1) 打开 “19-2” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 ” 
|“ 旧 对 话 框 ”|“ 误 差 条 形 图 ”命令 ， 打 开 “ 误 差 条 图 ”对 话 框 。 选 择 “简单 ”直观 表示 ， 在 
“图 表 中 的 数据 为 ”选项 组 中 选中 “个 案 组 摘要 ” 单 选 按钮 。 

2) 单 击 “定义 ”按钮 ， 弹 出 “定义 简单 误差 条 形 图 : 个 案 组 摘要 ”对 话 框 。 从 变量 列表 
框 中 分 别 将 “教育 水 平 ”和 “当前 薪金 ” 选 入“ 类别 轴 ” 变 量 放置 区 和 “变量 ”列表 框 中 。 

3) 打开 “标题 ”对 话 框 ， 将 “简单 误差 条 图 示例 ”输入 “第 1 行 ”文本 框 中 作为 输出 图 
形 的 标题 ， 单 击 “ 继 续 ”按钮 保存 设置 回 到 主 对 话 框 ， 其 他 采用 默认 设置 。 

4) 所 有 设置 完毕 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 
口中 输出 图 形 ， 结 果 如 图 19-59 所 示 。 


简单 误差 条 图 示例 
$125.000] 下 
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图 19-59 简单 误差 条 图 输出 结果 
19.9.3 ”复式 误差 条 图 绘制 的 SPSS 操作 


复式 误差 条 图 绘制 的 SPSS 操作 过 程 与 简单 误差 条 图 绘制 过 程 类 似 。 下 面 将 对 其 绘制 过 程 
进行 简单 介绍 。 
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1) 打开 “19-2” 数 据 文件 ,进入 SPSS Statistics 数据 编辑 器 窗口 ,在 菜单 栏 中 选择 “图 形 ” 
1“ 旧 对 话 框 ”| “误差 条 形 图 ”命令 ,打开 “误差 条 图 ”对 话 框 。 这 里 选择 “ 簇 状 ”直观 表示 ， 
在 “图 表 中 的 数据 为 ”选项 组 中 选中 “个 案 组 摘要 ” 单 选 按 钮 。 

2) 单 击 “ 定 义 ” 按 钮 ， 弹 出 “定义 艇 状 误差 条 形 图 : 个 案 组 摘要 ”对 话 框 。 从 变量 列表 
“性 别 ” 变 量 分 别 先入 “类 别 轴 ” 变 量 放置 区 、“ 变 量 ” 


框 中 将 “教育 水 平 ”“ 当 前 薪金 ”和 
和 “本 类 定义 依据 ”列表 框 中 ， 其 他 仍 采 用 默认 设置 ， 如 图 19-60 所 示 。 
3) 打开 “标题 ”对 话 框 ， 将 “ 簇 状 误差 条 图 示例 ”输入 “第 1 行 ”文本 框 中 作为 输出 图 
形 的 标题 ， 单 击 “ 继 续 ”按钮 保存 设置 。 
4) 所 有 设置 完毕 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 


口中 输出 图 形 ， 


结果 如 图 19-61 所 示 。 
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图 19-60 “定义 簇 状 误差 条 形 图 : 个 案 组 摘要 ”对 话 框 图 19-61 簇 状 误差 条 图 输出 结果 


由 图 可 以 明显 看 出 ， 当 前 薪金 的 均值 与 受 教育 年 限 基本 保持 正 向 关系 ， 受 教育 年 限 大 于 
17 年 的 几乎 都 是 男 员工 ， 且 随 着 受 教育 年 限 的 增长 ， 当 前 薪金 的 均值 变化 幅度 呈 增 长 趋势 。 


19.10 高 低 图 


高 低 图 可 以 形象 地 向 用 户 呈 现 出 单位 时 间 内 某 变量 的 最 高 值 、 最 低 值 和 最 终 值 。 它 是 专 为 
观察 股票 、 期 货 、 外 汇 等 市 场 波 动 趋势 而 设计 的 。 

如 图 19-62 所 示 为 高 低 图 的 示例 ， 图 中 均值 代表 每 个 交易 日 股票 价格 的 平均 值 ， 最 小 值 和 
最 大 值 分 别 代 表 每 个 交易 日 的 股票 的 最 低 价格 和 最 高 价格 。 
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图 19-62 高 低 图 示例 
19.10.1 高 低 图 的 类 型 


高 低 图 适合 于 描述 每 小 时 、 每 天 和 每 周 等 时 间 内 不 断 波动 的 资料 , 可 以 说 明 某 些 现象 在 短 
时 间 内 的 变化 ， 也 可 以 说 明 它们 的 长 期 变化 趋势 ， 例 如 股票 、 商 品 价格 和 外 汇 变动 等 信息 。 

SPSS 24.0 共 提供 了 5 种 类 型 的 高 低 图 ， 即 简单 高 低 收盘 图 、 分 类 高 低 收盘 图 、 差 异 面积 
图 、 简 单 范围 选项 组 和 群集 范围 选项 组 。 简 单 高 低 收盘 图 用 小 方 框 表示 某 段 时 间 内 的 收盘 值 ， 
小 方 框 上 下 的 触须 表示 该 段 时 间 内 的 最 大 值 和 最 小 值 ; 分 类 高 低 收盘 图 利用 不 同 的 简单 高 低 收 
盘 图 表示 分 类 变量 取 不 同 值 时 对 应 的 情况 ; 差异 面积 图 利用 不 同 的 曲线 表示 同一 段 时 间 内 的 两 
种 不 同情 况 , 并 且 用 阴影 填充 曲线 之 间 的 区 域 ; 简单 范围 选项 组 利用 简单 条 形 图 表示 简单 高 低 
极 差 图 中 最 大 值 和 最 小 值 之 间 的 长 度 ;群集 范围 选项 组 利用 不 同 的 简单 高 低 极 差 图 表示 分 类 变 
量 取 不 同 值 时 对 应 的 情况 。 

每 种 图 形 类 型 包含 3 种 不 同 模式 ， 即 个 案 组 模式 、 变 量 分 组 模式 和 个 案 模 式 。SPSS 24.0 
共 提 供 了 15 种 可 用 高 低 图 组 合 供用 户 选择 。 


19.10.2 ”高 低 图 绘制 的 SPSS 操作 


SPSS 24.0 主要 提供 了 图 表 构 建 器 和 旧 对 话 框 程序 两 种 方法 绘制 高 低 图 。 本 节 使 用 “19-3” 
数据 文件 介绍 各 种 高 低 图 的 绘制 操作 过 程 。 
“19-3” 数 据 文件 来 源 于 SPSS 24.0 自 带 的 “stocks1904.sav” 数 据 文件 ， 该 数据 文件 涉及 
1994 年 每 个 股票 交易 日 的 日 期 、 开 盘 价 和 收盘 价 、 最 低 价 和 最 高 价 及 交易 量 等 。 


1. 实验 数据 描述 


打开 “19-3” 数 据 文件 ， 在 SPSS Statistics 数据 编辑 器 窗口 中 可 以 看 到 “19-3” 数 据 文件 
中 的 变量 描述 ， 如 图 19-63 所 示 。 
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起 霹 EeRi 国 给 利 3.sav 癌 固 竺 1] - 上 M SPSS Statistics 教 天 六 返 盏 三 日 区 


IEJEOIEIEIEI 


TBW SPSS Statistics 处 理 程序 就 绪 | | |Unicode'ON| 
图 19-63 “19-3” 数 据 文件 的 变量 描述 
2. 高 低 图 的 SPSS 操作 过 程 


下 面 以 简单 高 低 图 的 绘制 为 例 , 简单 介绍 如 
何 使 用 图 表 构建 器 绘制 高 低 收盘 图 , 用 户 可 以 参 
照 前 文学 习 其 他 方法 及 其 他 种 类 高 低 图 的 绘制 

1) 打 开 “19-3 "数据 文件 ,进入 SPSS Statistics 
数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 ”| “图 
表 构 建 器 ”命令 ， 打 开 “ 图 表 构 建 器 ”对 话 框 。 

2) 在 “选择 范围 ”列表 框 中 选择 “ 盘 高 - 盘 
低 图 ”， 然 后 从 右 侧 显示 的 直观 表示 中 双击 简单 
高 低 图 直观 表示 [中 或 将 其 选择 拖 入 画布 中 .将 变 
量 “Date” 拖 入 横 轴 变量 放置 区 内 ， 将 “High” a 
“Low” 和 “Close” 分 别 拖 入 “高 变量 ”“ 低 变 
量 ” 和 “关闭 变量 ”变量 放置 区 内 ， 如 图 19-64 Ss 
所 示 。 19-64 ”设置 高 低 图 的 元 素 

3) 在 “标题 /脚注 ”选项 卡 中 选中 “标题 1” 复 选 框 ， 并 在 “元 素 属性 ”对 话 框 的 “内 容 ” 
文本 框 中 输入 “简单 高 低 图 示例 ”作为 输出 简单 高 低 图 的 标题 ,设置 完毕 后 ， 单 击 “ 应 用 ” 按 
钮 使 设置 生效 。 

4) 所 有 设置 结束 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 
口中 输出 图 形 ， 结 果 如 图 19-65 所 示 。 


EL 
加 
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简单 高 低 图 示例 
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19-65 ”简单 高 低 图 输出 结果 


19.11 ”时 间 序 列 图 


时 间 序列 图 是 用 来 反映 测量 指标 随时 间 的 变化 趋势 的 统计 图 形 。 用 户 可 以 利用 时 间 序 列 图 
动态 地 认识 事物 的 本 质 , 研究 几 个 时 间 序 列 之 间 的 差别 , 认识 时 间 序列 的 周期 性 并 预测 序列 未 
来 的 走势 等 。 

SPSS 24.0 共 提 供 了 4 种 形式 的 时 间 序列 图 : 普通 序列 图 、 自 相关 序列 图 、 偏 相关 序列 图 
和 互相 关 序 列 图 ， 下 面 将 结合 实例 分 别 进行 讲述 。 


19.11.1 普通 时 间 序 列 图 


普通 时 间 序 列 图 就 是 对 变量 的 观测 记录 按照 当前 顺序 作 图 , 从 而 反映 一 个 或 几 个 变量 观测 
值 随时 间 的 变化 趋势 。 

本 节 所 使 用 的 数据 文件 依然 是 “19-3” 数 据 文件 ， 该 数据 文件 的 相关 变量 描述 在 前 面 已 经 
介绍 ， 在 此 不 再 奖 述 。 


1) 打开 “19-3” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 析 ” 
|“ 时 间 序 列 预测 ”|“ 序 列 图 ”命令 ， 打 开 如 图 19-66 所 示 的 “序列 图 ”对 话 框 。 

2) 从 变量 列表 框 中 将 “High” 选 入 “变量 ”列表 框 中 ， 将 “Date” 选 入 “时 间 轴 标签 ” 
列表 框 中 ， 其 他 均 采 用 默认 设置 。 

3) 设置 完毕 后 ， 单 击 “ 序 列 图 ”对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 
器 窗口 得 到 普通 时 间 序 列 图 的 相关 结果 ， 如 图 19-67~ 图 19-69 所 示 。 


如 图 19-67 所 示 的 模型 描述 给 出 了 模型 的 相关 信息 , 包括 模型 的 名 称 、 时 间 序 列 变量 的 个 
数 、 是 否 对 作 图 变量 进行 了 转换 及 转换 方法 、 是 否 进行 了 季节 性 差分 及 差分 阶 数 等 。 

图 19-68 所 示 为 个 案 处 理 摘 要 ,给 出 了 有 关 数 据 集 的 使 用 信息 ， 由 图 可 以 看 出 ,该 时 间 序 
列 共 使 用 252 个 个 案 ， 没 有 任何 缺失 值 。 
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息 多 图 x 


国 手 节 性 兰 哇 GG): 1 
当前 局 基 长 度 : 无 
加 每 个 变量 对 应 一 个 图 表 (O) 
EE 
图 19-66 “序列 图 ”对 话 框 
模型 描述 
模 弄 名 称 MoD_1 
系列 或 序列 1 High 
逢 换 无 
非 季节 性 落 分 0 
季节 性 每 分 0 
季节 性 周期 长 度 无 周期 长 度 个 案 处 理 摘要 
水 平 畏 标 Date High 
Ei 系列 或 序列 长 度 加 | 252 
次 绕 下 方 的 区 二 本 大 图 中 的 缺失 值 数 日 。 用 户 缺 失 值 0 
正在 应 用 来 自 MOD_1 的 模型 指定 项 系统 缺失 值 0 
图 19-67 模型 描述 图 19-68 个 案 处 理 摘要 
图 19-69 给 出 了 股票 价格 最 高 值 随 时 间 的 变化 趋势 ， 可 见 最 高 值 在 一 年 内 波动 性 较 大 。 
zn 
各 
人 
HH 


图 19-69 普通 时 间 序 列 图 输出 结果 
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19.11.2” 自 相 关 序列 和 偏 相关 序列 图 绘制 的 SPSS 操作 


自 相关 序列 和 偏 相 关 序 列 图 分 别 用 于 描述 时 间 序 列 的 自 相关 函数 和 偏 相关 函数 。 


1) 打开 “19-3” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 析 ” 
1“ 时 间 序 列 预测 ”|“ 自 相关 ”命令 ,打开 “ 自 相关 性 ”对 话 框 。 
2) 从 变量 列表 框 中 将 “High” 选 入 “变量 ”列表 框 中 ， 
其 他 采用 默认 设置 。 
3) 单 击 “ 自 相关 性 ”对 话 框 中 的 “选项 ”按钮 ， 打 开 


标准 误差 法 一 一 一 一 一 一 一 一 
如 图 19-70 所 示 的 “ 自 相关 性 : 选项 ”对 话 框 ， 对 话 框 中 各 © 
选项 的 含义 介绍 如 下 。 Ed 


图 在 周 基 性 延 jR 处 显示 自 相关 性 (D) 


| 蛤 自 相关 性 : 选项 x 


最 大 延迟 孝 (M): 国 ] 


。 “最 大 延迟 数 ”文本 框 : 在 “最 大 延迟 数 ” 文 本 框 中 | 
可 以 输入 新 的 数字 ， 以 定义 自 相关 或 偏 相关 的 一 个 最 
大 延迟 数 。 图 19-70 “ 自 相关 : 选项 ”对 话 框 


。 “标准 误差 法 ”选项 组 : 该 选项 组 用 于 选择 计算 标准 误差 的 方法 , 只 适用 于 自 相关 序列 图 。 
若 选中 “独立 模型 ” 单 选 按钮 ， 则 表示 假设 数据 为 白 噪声 序列 ; “巴特 利 特 近 似 ” 单 选 按 
钮 适用 于 k-1 阶 的 滑动 平均 序列 。 
。 “在 周期 性 延迟 处 显示 自 相关 性 ” 复 选 框 : 选中 该 复 选 框 ， 表示 只 输出 延迟 阶 数 为 序列 周 
期 长 度 的 自 相关 或 偏 相 关 序列 。 
4) 所 有 设置 结束 后 ， 单 击 “ 自 相关 性 ”对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 
查看 器 窗口 中 输出 如 图 19-71~ 图 19-76 所 示 的 结果 。 


模型 描述 

模型 名 称 MOD_2 
序列 名 称 1 High 
转换 无 

非 季节 性 将 分 0 

季节 性 着 分 | 0 个 案 处 理 摘要 

季节 性 周期 长 度 无 周期 长 度 High 
最 大 延迟 数 16 序列 长 应 252 
性 证 第 让 相关 性 标准 误 关 而 很 定 的 过 程 。 独立 性 《 白 贱 声 ) * 缺失 值 的 数目 用 户 缺失 值 0 
显示 和 给 制 所 有 延迟 系统 缺失 值 0 
正在 应 用 来 自 MOD_2 的 模型 指定 硕 有 效 值 的 数目 252 
a, 不 适用 于 计算 偏 自 相关 性 的 标准 误差 。 可 计算 的 首次 延迟 数 251 

图 19-71 模型 描述 图 19-72 ”个 案 处 理 摘要 


模型 描述 图 和 个 案 处 理 摘要 反映 的 信息 与 普通 序列 图 的 输出 结果 基本 一 致 ， 在 此 不 再 袭 述 。 

19-73 和 图 19-74 分 别 给 出 了 自 相关 性 和 自 相 关 图 ， 由 两 图 可 以 看 出 ， 股 票 最 高 值 存在 
明显 的 自 相关 关系 ， 且 在 一 个 周期 内 自 相 关 函 数 有 较为 明显 的 拖 尾 现象 。 

19-75 和 图 19-76 给 出 了 偏 自 相关 性 和 偏 相 关 图 ， 由 图 19-76 可 以 明显 看 出 股票 最 高 价 
格 的 偏 相 关 函 数 在 一 个 周期 内 有 较为 明显 的 截 尾 现象 。 
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自 相关 性 
到 :High High 
傅 交 村 -所 统计 fm 
二 和 相关 性 标识” 村 。 | 自 内 度 | 也 人 a [三 
1 916 063 243157 1 oo 
ED 062 473455 000 
3 319 062 。 690756 3 000 Ea 
ao 062 B95 224 4 oo0 
5 860 062 1086874 5 000 
6 829 062 1265 501 5 oo0 
”RT] 062 1432000 7 000 Ee 
a 371 062 1588.025 8 000 
a 745 062 1734121 9 000 
1 7 061 1871 589 10 oo0 
1 95 061 2000110 11 000 2 
12 567 061 2118751 12 oo00 
加 638 061 2227798 13 000 
14 610 061 2327.927 14 000 
5 563 061 2419 651 15 oo0 A 
加 554 061 2502 937 16 000 
人 训 的 科 林 过 各 为 台 立 性 《 自 吕 声 ) 。 要 归 归 敌后 涛 要 归 和 EY 
hb. 属于 关 巡 上 方 近 人。 渍 后 访 呈 
图 19-73 自 相关 性 19-74” 自 相关 图 
High 
偏 自 相关 性 g 人 
Pt Hon ， 己 -二 中 
古 还。 信 自 相关 性 | 标准 训 
1 976 063 
110 063 
al 025 063 
4 020 063 
5 030 063 
04: 063 外 
7 o17 063 号 
日 036 063 
a 001 063 
10 035 063 as 
11 .057 063 
位 -087 063 
1 011 063 
14 006 063 1 
15 -007 063 [要 最 归 扫 归 用 量 时 和 和 
15 -037 063 海 后 编号 


图 19-75 偏 自 相关 性 


19.11.3 ”互相 关 序 列 图 


互相 关 函 数 表示 两 个 时 间 序 列 之 间 的 相关 系数 , 用 于 表现 不 同 序列 之 间 的 相关 关系 , 它 只 
适用 于 时 间 序 列 数据 。 下 面 以 “19-3” 数 据 文件 为 例 ， 讲 解 绘制 互相 关 序 列 图 的 具体 过 程 。 


1) 打开 “19-3” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ,在 菜单 栏 中 选择 “分 析 ” 
| “时 间 序 列 预测 ”|“ 交 叉 相 关 性 ”， 打 开 “ 交 叉 相 关 性 ”对 话 框 。 该 对 话 框 界面 同样 与 “ 序 
列 图 ”对 话 框 极为 相似 。 

2) 从 变量 列表 中 将 “High” 和 “Low” 选 入 “变量 ”列表 中 ， 其 他 采用 默认 设置 。 

3) 单 击 “ 交 叉 相 关 性 ”对 话 框 中 的 “选项 ”按钮 ， 弹 出 “交叉 相关 性 : 选项 ”对 话 框 ， 
这 里 采用 默认 设置 即 可 ， 单 击 “ 继 续 ” 按 钮 回 到 主 对 话 框 中 。 

4) 所 有 设置 结束 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 
口 输出 如 图 19-77 和 图 19-78 所 示 的 结果 。 


图 19-76“” 偏 相关 图 
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模型 描述 

模型 名 称 MOD_3 
序列 名 称 1 High 

2 Low 
转换 无 
非 季节 性 差分 0 
大 季 性 到 分 0 个 案 处 理 摘要 
大 性 周期 长 讼 。 无 周 其 长度 序列 长度 252 
延 巡 范围。 从 EE 国 为 以 下 不 因而 排除 的 个 用 户 缺失 值 0 

| 7 系统 峡 失 什 0 
Pr 下 有 效 个 过 252 
正在 应 用 来 自 MOD_3 的 横 型 指定 项 差分 后 可 计算 的 于 阶 相 关 性 系数 的 数目 252 


图 19-77 模型 描述 和 个 案 处 理 摘要 


交叉 相关 性 
序列 对 :High， 营 有 Low High, 带 有 Low 
证 让 交叉 相关 性 ”标准 误差 > 目 系数 
-7 786 064 sf et 
-6 817 064 
-5 .847 .064 
4 .878 064 a 
区 809 063 
-2 .941 063 
-1 972 063 
0 995 063 8% 
> | .978 063 
2 949 063 
3 .920 063 | 
L 避 下 .892 .064 
5 .862 064 
6 832 ‘064 
7 800 064 Ad 
和 rd dd 
声 的 假定 。 浪 后 编号 


图 19-78 ”交叉 相关 性 和 互相 关 图 
由 图 19-77 可 以 看 出 ， 两 个 序列 交叉 相关 关系 显著 ， 但 在 零 延 迟 时 相关 性 最 强 。 


19.12” 双 轴线 图 


不 同 作 图 对 象 的 度量 单位 不 同 或 者 数量 级 不 同 ,通常 的 图 形 无 法 同时 显示 这 些 不 一 致 的 变 
量 信息 。SPSS 24.0 中 双 轴 线 图 就 是 专门 用 来 解决 这 个 问题 的 ， 它 在 一 个 图 中 给 出 两 个 纵 坐标 
轴 ， 分 别 用 来 刻画 不 同 的 变量 。 

我 们 将 继续 使 用 “19-3” 数 据 文 件 ， 简 单 讲解 双 轴 线 图 的 绘制 过 程 。 

具体 操作 过 程 如 下 : 


1) 打开 “19-3” 数 据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “图 形 ” 
|“ 图 表 构建 器 ”命令 ， 打 开 “ 图 表 构 建 器 ”对 话 框 。 
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19-79 设置 双 轴 线 图 元 素 


2) 在 “选择 范围 ”列表 框 中 选择 “ 双 轴 图 ”， 然 后 从 右 侧 显示 的 直观 表示 中 双击 双 轴 线 
直观 表示 [| 或 将 其 选择 拖 入 画布 中 。 将 变量 “Date” 拖 入 横 轴 变 量 放 置 区 内 ， 将 变量 “High” 
和 “Close” 分 别 拖 入 左右 纵 轴 变量 放置 区 内 。 

3) 与 绘制 其 他 图 形 一 样 ， 可 在 “元 素 属性 ”对 话 框 中 对 所 有 元 素 属性 可 选项 进行 设置 。 
在 “标题 /脚注 ”选项 卡 中 选中 “标题 1” 复 选 框 ， 并 在 “元 素 属性 ”对 话 框 的 “内 容 ” 文 本 
框 中 输入 “ 双 轴 线 图 示例 ”作为 输出 双 轴 线 图 的 标题 ， 设 置 完毕 后 ， 单 击 “ 应 用 ”按钮 使 设置 
生效 。 

4) 所 有 设置 结束 后 ， 单 击 主 对 话 框 中 的 “确定 ”按钮 ， 即 可 在 SPSS Statistics 查看 器 窗 
口中 输出 图 形 ， 结 果 如 图 19-80 所 示 。 


双 和 轴线 图 示例 


图 19-80” 双 轴线 图 输出 结果 
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19.13 上 机 题 


| 视频 文件 ，\ 多 媒体 文件 上 机 题 教学 视频 ,chapl9.wmv 


| 画 视频 文件 :\ 源 文件 上 机 题 \chap19\.… 


19.1 题 中 数据 为 某 工 厂 职 工 的 部 分 基本 信息 ， 包 括 每 个 职工 的 年 龄 、 性 别 、 婚 姻 状 况 
、 受 教育 程度 、 收 入 工作 年 限 类 别 及 工作 满意 程度 等 ， 其 中 ， 性 别 变量 中 男 、 女 分 别 用 1、2 
表示 ， 按 教育 程度 把 员工 分 为 5 类， 婚姻 状况 中 用 0 代表 未 婚 、1 代表 已 婚 ， 其 他 数据 含义 可 
参考 源 数据 文件 的 变量 视图 数据 路 径 : 视频 文件 \sample\ 上 机 题 \chap19\ 习 题 \ 第 19 章 第 一 题 


.SaV) 。 


收入 工作 年 限 | 工作 年 限 | 工作 满意 
56 和 1 35 3 4 
28 2 3 4 二 当 
24 1 4 0 1 1 
此 1 党 5 2 2 
45 1 3 13 2 2 
42 1 3 10 2 2 
35 2 2 1 1 1 
46 2 1 11 C1 
34 1 3 i2 2 4 
355 2 这 2 用 委 
28 1 4 4 和 
31 2 4 0 1 pa 
42 2 3 3 浊 
3 I | 9 2 4 
52 1 4 16 3 5 
21 和 3 0 1 1 
32 2 1 4 1 4 
42 和 好 20 3 3 


(1) 倘 决 策 者 希望 了 解 不 同 受 教育 水 平 己 婚 职工 和 未 婚 职 工 之 间 的 收入 差别 ， 试 用 条 形 
图 反映 有 关 信息 。 

(2) 利用 题 中 的 数据 ， 绘 制 一 个 线 图 ， 以 反映 出 不 同 受 教育 水 平 的 男 职工 和 女 职工 之 间 
的 收入 差异 。 

(3) 利用 题 中 的 数据 ， 绘 制 出 反映 不 同 受 教育 程度 员工 数量 的 饼 图 。 


471 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


(4) 利用 题 中 的 数据 ， 绘 制 一 个 散 点 图 ， 使 之 能 够 反映 出 不 同 工 作 年 限 类 别 员 工 的 工作 
满意 程度 。 

(5) 利用 题 中 的 数据 ， 绘 制 出 可 以 反映 不 同 工 作 年 限 类 别 收 入 水 平 的 箱 图 。 

(6) 利用 题 中 的 数据 ， 绘 制 出 可 以 反映 不 同 工 作 年 限 类 别 收入 水 平 的 误差 条 图 。 


19.2 题 中 数据 给 出 了 2007 年 某 股票 83 个 交易 日 的 交易 信息 表 的 部 分 信息 ， 包 括 每 个 交 
易 日 该 股票 的 开盘 价 、 收 盘 价 、 最 高 价 和 最 低 价 及 每 日 交易 量 等 ， 分 别 对 应 数据 表 中 的 “ 
Open”“Close”“High”“Low” 和 “Volume” 变 量 ，“Date” 变 量 表示 交易 日 日 期 (数据 
路 径 : 视频 文件 \sample\ 上 机 题 \chap19\ 习 题 \ 第 19 章 第 二 题 .sav) 。 


日 其 开盘 价 (元 ) | 最 高 价 (元 ) | 最 低 价 (元 ) | 收盘 价 (元 ) | 交易 量 ( 手 ) 
31-Aug-07 37.5 42.15 19.62 38.1 12989100 
30-Aug-07 55.8 55.78 36.47 36.49 10076400 
27-Aug-07 站 66.25 54.77 62.09 10110700 
26-Aug-07 55.8 60.39 48.88 52.92 11838300 
25-Aug-07 36.7 61.79 30.3 60.72 13206400 
24-Aug-07 46.9 50.29 28.51 36.89 13010900 
23-Aug-07 43.8 48.12 35.11 38.7 12246600 
20-Aug-07 19.5 43.12 15.92 38.02 13426500 
19-Aug-07 259 29.13 11.68 0.89 14167300 
18-Aug-07 87.7 31.37 84.6 31.37 15750500 
17-Aug-07 3 4.59 9195 95.25 13902800 
16-Aug-07 59.6 89.49 59.58 82.84 12897300 
13-Aug-07 62.5 68.63 50.82 57.22 13477500 
12-Aug-07 70.7 74.68 $51.95 52.49 16326600 

(1) 试 运用 SPSS 提供 的 绘图 程序 绘制 出 反映 该 股票 每 日 价格 最 高 值 和 最 低 值 信息 的 高 

低 图 。 


(2) 绘制 出 该 股票 每 个 交易 日 收盘 价 的 时 间 序列 图 , 并 对 每 日 收盘 价格 进行 自 相关 分 析 。 
(3) 仿照 19.12 节 的 例题 格式 ， 创 建 双 轴 线 图 ， 使 之 同时 反映 出 该 股票 每 日 收盘 价格 和 
交易 量 。 
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随 着 管理 精确 化 的 发 展 和 统计 分 析 方法 的 进步 ,定量 分 析 在 科学 研究 和 实际 的 生产 实践 中 
得 到 了 广泛 的 应 用 。 计 算 机 技术 和 统计 软件 在 定量 分 析 中 扮演 了 重要 的 角色 。 由 于 SPSS 具有 
界面 友好 、 操 作 简 单 、 功 能 强大 、 与 其 他 软件 交互 性 好 和 结果 易于 判读 等 优点 ， 被 广泛 应 用 于 
经 济 管理 、 医 疗 卫 生 、 自 然 科学 等 各 个 领域 。 

随 着 现代 科学 研究 和 生产 实践 分 析 的 发 展 ,利用 单一 的 统计 方法 进行 分 析 已 经 无 法 满足 实 
际 需要 , 多 种 统计 方法 的 复合 式 应 用 已 成 为 现代 定量 分 析 技 术 发 展 的 新 趋势 .本 章 选 取 了 医学 、 
自然 科学 、 社 会 科学 和 经 济 管理 中 的 典型 问题 ， 利 用 SPSS 统计 分 析 方 法 进行 实际 分 析 ， 读 者 
可 以 从 中 学 习 到 问题 分 析 的 思路 、 软件 的 操作 及 如 何 对 输出 结果 进行 分 析 , 以 及 提高 解决 复杂 
定量 分 析 问 题 的 能 力 。 


20.1 SPSS 在 医学 中 的 应 用 


由 于 医学 领域 的 特殊 性 , 无 论 是 新 药 的 开发 研制 还 是 新 的 治疗 方法 的 应 用 , 都 要 经 过 长 期 
的 观测 和 反复 的 实验 对 比 。SPSS 的 统计 分 析 过 程 为 医学 领域 观测 与 试验 的 结果 分 析 和 研究 提 
供 了 有 力 的 帮助 ， 在 医疗 、 卫 生 统计 和 流行 病 学 调查 方面 具有 广泛 的 应 用 。SPSS 常用 于 医学 
领域 的 统计 分 析 过 程 包括 方差 分 析 、 判 别 分 析 、 生 存 分 析 等 。 


20.1.1 ”问题 描述 与 案例 说 明 


在 医疗 领域 中 对 于 症状 的 早期 诊断 一 直 是 一 项 重要 的 任务 , 大 量 的 临床 案例 的 积累 为 早期 
诊断 的 研究 提供 了 重要 的 基础 依据 。 而 SPSS 为 分 析 研 究 这 些 基础 性 资料 并 得 到 相关 的 结论 提 
供 了 有 力 的 帮助 。 

先天 性 巨 结 肠 症 由 于 其 手术 创伤 大 、 输血 量 多 和 患者 多 为 婴儿 等 特点 , 其 术 后 感染 成 为 了 
医学 研究 的 重要 领域 .对 术 后 感染 情况 的 早期 预测 和 诊断 成 为 了 降低 手术 死亡 率 和 提高 手术 成 
功率 的 重要 一 环 。 本 书 以 北京 儿童 医院 李 龙 教授 的 * 围 手术 期 输血 与 先天 性 巨 结肠 症 术 后 感染 ” 
研究 为 例 ， 讲 解 SPSS 在 医学 中 的 应 用 。 


20.1.2 ”分 析 目的 和 分 析 思 路 


本 案例 的 分 析 目 的 是 希望 得 出 先天 性 巨 结肠 手术 后 是 否 发 生 感 染 的 相关 影响 因素 ， 并 建立 术 
后 感染 与 否 的 预测 诊断 函数 ， 以 便 对 一 个 手术 后 婴儿 的 感染 发 生 进行 早期 诊断 。 此 外 我 们 还 关心 
手术 的 方式 对 婴儿 手术 后 是 否 发 生 感 染 的 影响 ,以 便 设立 科学 合理 的 手术 机 制 , 减少 感染 的 发 生 。 

本 案例 的 分 析 思 路 是 : 首先 利用 方差 分 析 方 法 分 析 不 同 手术 方式 的 结果 是 否 存 在 显著 差 
异 ; 然后 利用 判别 分 析 方 法 建立 判别 函数 ， 利 用 判别 函数 分 析 影响 术 后 感染 的 主要 因素 ， 并 对 
新 观测 到 的 案例 予以 分 类 。 
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该 研究 观测 了 在 北京 儿童 医院 接受 先天 性 巨 结 肠 手术 30 名 儿童 的 性 别 、 月 龄 、 红 细胞 压 
积 、 手 术 方 式 、 疾 病 部 位 、 手 术 持 续 时 间 (分 钟 )、 手 术 失 血 量 (毫升 ) 、 手 术 中 输血 次 数 、 
手术 中 输血 量 (毫升 每 千克 ) 和 感染 与 否 等 信息 。 另外 案例 还 观测 了 3 名 刚刚 结束 手术 还 无 法 


确定 感染 结果 的 儿童 的 情况 ,试图 利用 判别 分 析 确 定 的 判别 函数 对 这 3 名 儿童 的 术 后 感染 情况 

让 和 一 了 、 一 

进行 预测 ， 该 案例 的 原始 数据 〈 部 分 ) 如 图 20-1 所 示 。 

T T et ie et! SEE 
C1] 5 有 纪 引 区 【%) 玉林 方式 。 妆 康 部 位 。 笠 瑚 纺 对 《分 诈 ) 下 下 天 自 委 (这 天” 于 本 下 二 克 束 【 次 三 让 中 第 血 基 【雪人 斤 】 咸 水 与 

18 本 4 于 并 局 必 mm 而 1 而 未 杰 染 
2 n E EE 2 各 1 全 趟 夺 染 
3 另 0 wae 5 190 和 1 14 未 肝 当 
4 马 到 3 网 人 要 走 及 0 习习 
5 女 7| 7 乙 相 二 也 1 各 1 呆 让 贡 训 
5 六 日 林 .4 吻 宫 医 。 蕊 要 205 0 a 呈 示 感染 
71% 本 | 2 0 21 下 二 当 
日 1 人 2 Ea 
9 1 林 D 吻 宫 兽 二 各 160 0 下 林 大 涂 
0 多 4 315 旷 8 闫 。。 乙 改 本 190 和 1 习 未 中 丈 
人 1 昌 本 47 更 190 站 1 人 0 计 历 
全 遇 引 1 忆 盟 冯 如 ”乙酉 To 各 1 Ee 
3 1 [| 135 对 五 未 员 史 
估 台 引 466 及 所 245) 如 1 3 
二 加 区 4 呈 训 本 乙 忆 天 2 E23 
16 男 四 本 1 咬 官 首 。 忆 状 结 了 站 1 9 
人 7 马 1 色目 曙 合 问 。 乙 居 纪 隐 型 wm 3 
刘 轴 二 1 内 全 切 寻 避 25 0 古 让 感 涡 
9 另 | 412 啤 襄 省 。。 缚 寺 25 加 1 3 
Er 本 村 8 同人 关 “下 甩 0 如 1 11 来 胡 各 
EE 2 和 27 网 全 要 姑且 1 习 4 0 证 消 
Ea 7 37 7 的 3 了 0 昌林 面 染 
召见 § 王刚 让 入 己 居 隔 140 如 1 他 未 月 史 
2 4 7 书本 入 0, 如 4 而 帮 
Ei 日 全 3 助 冯 可 艺术 165 各 1 3 万 澳 
瑟 另 3 本 开户 如 130 10 E23 
如 日 相 5 辐 霹 书局 取 175 如 15 5 
Ea 可 1 环 记 志和 140 的 如 林寺 澳 
Ea 502 响 音 首 站 尖 25 Ey EE 


20-1 案例 原始 观测 数据 


20.1.3 ”案例 中 使 用 的 SPSS 方法 


1. 方差 分 析 


方差 分 析 是 一 种 假设 检验 , 它 把 观测 总 变异 的 平方 和 与 自由 度 分 解 为 对 应 不 同 变异 来 源 的 
平方 和 和 自由 度 , 将 某 种 控制 性 因素 所 导致 的 系统 性 误差 和 其 他 随机 性 误差 进行 对 比 , 从 而 推 
断 各 组 样本 之 间 是 否 存在 显著 性 差异 以 分 析 该 因素 是 否 对 总 体 存在 显著 性 影响 。 


2. 判别 分 析 


判别 分 析 是 在 分 类 数目 己 知 的 情况 下 ,根据 已 经 确定 分 类 的 对 象 的 某 些 观测 指标 和 所 属 类 
别 来 判断 未 知 对 象 所 属 类 别 的 一 种 统计 学 方法 。 判 别 分 析 通 常会 建立 一 个 或 多 个 判别 函数 , 用 
研究 对 象 的 大 量 资料 确定 判别 函数 中 的 待定 系数 , 并 计算 判别 指标 。 对 一 个 未 确定 类 别 的 个 案 
只 要 将 其 代入 判别 函数 就 可 以 判断 它 属于 哪 一 类 总 体 。 常用 的 判别 分 析 方 法 有 距离 判别 法 、 费 
合 尔 判别 法 和 贝 叶 斯 判别 法 。 


20.1.4 数据 文件 的 建立 


首先 在 SPSS 变量 视图 中 建立 变量 “编号 ”“ 性 别 ”“ 月 龄 ”“ 红 细胞 压 积 ”“ 手 术 方式 ”“ 疾 病 
部 位 ”“ 手 术 持续 时 间 ”“ 手 术 失 血 量 ”“ 手 术 中 输血 次 数 ”“ 手 术 中 输血 量 ” 和 “感染 与 否 ”， 分 别 
用 来 表示 性 别 、 月 龄 、 红 细胞 压 积 、 手 术 方式 、 疾 病 部 位 、 手 术 持 续 时 间 (分 钟 ) 手术 失血 量 ( 毫 
升 )、 手 术 中 输血 次 数 、 手 术 中 输血 量 (毫升 每 公斤 》 和 感染 与 否 等 观测 信息 。 其 中 ,“ 疾 病 部 位 ” 
变量 中 使 用 数值 “1、2、3” 分 别 表示 “乙状结肠 ”“ 结 肠 ” 和 “直肠 ”“ 手 术 方式 ”变量 中 使 用 数 
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值 “1、2、3” 分 别 表 示 “ 环 形 ”“Z 型 ”和 “吻合 器 ”"“ 性 别 ”变量 使 用 数值 “1、0” 分 别 表示 “ 男 ” 
和 “ 女 ”， 感 染 与 否 也 使 用 数值 “1、0” 表 示 ， 如 图 20-2 所 示 。 


起 'spsSEEE 池 中 在 肌 sav 法 如 和 1] -IBM SPS5 Statictics 歼 且 有 - 器 x 
2 
:局 园 县 园 -1 一 各 | Cr 


图 20-2 案例 的 变量 视图 
在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 部 分 
数据 如 图 20-3 所 示 。 


| 办 "5psS 丰 区 中 的 太 用 sv 随 报 1] - 四 NM 5P55 Startistics 可 机上 = 
EG CO 


EN SPSS Stahistcs 和 到 和 这 搁 | | [Unicode ON 


图 20-3 案例 数据 文件 的 数据 视图 
实验 的 具体 操作 步骤 如 下 : 
1. 不 同 手术 方式 术 后 感染 情况 分 析 的 操作 步骤 


人 ES6i) 在 菜单 栏 中 选择 “分 析 ”| “比较 平 均值 ”| “ 单 因素 ANOVA 检验 ”命令 ， 打 开 “ 单 
因素 ANOVA 检验 ”对 话 框 。 
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人 GE562 将 “感染 与 否 ” 选 入 “ 因 变 量 列 表 ” 列 表 框 中 ， 将 “手术 方式 ” 选 入 “因子 ”列表 


框 中 。 


GE5363 单 击 “选项 ”按钮 ， 弹 出 “ 单 因素 ANOVA 检验 : 选项 ”对 话 框 ， 选 中 “方差 齐 性 
检验 ”“ 平 均值 图 ” 复 选 框 ， 然 后 单 击 “继续 ”按钮 ， 保 存 设置 结果 。 


本 了 74 单 击 “ 确 定 ” 按 钮 输出 结果 。 


2. 术 后 感染 情况 影响 因素 分 析 的 操作 步骤 


人 GE) 在 菜单 栏 中 选择 “分 析 ”|“ 分 类 ”| “判别 式 ” 命 令 ， 打 开 “ 判 别 分 析 ” 对 话 框 。 
人 ES6? 从 源 变量 列表 框 中 选择 “月 龄 ”“ 红 细胞 压 积 ”%“ 手 术 方式 ”“ 疾 病 部 位 ”“ 手 术 持续 


时 间 ”“ 手 术 失 血 量 ”“ 手 术 中 输血 次 数 ”"“ 手 术 中 输血 量 ”变量 ， 然 后 单 击 国 按钮 将 
它们 选 入 “ 自 变量 ”列表 框 中 ; 从 源 变量 列表 框 中 选择 “感染 与 否 ” 变量, 单 击 国 按 
钮 将 其 选 入 “分 组 变量 ”列表 框 中 。 


本 3703 单 击 “定义 范围 ”按钮 ， 弹 出 “判别 分 析 : 定义 范围 ”对 话 框 ， 在 该 对 话 框 中 输入 


违约 变量 的 取 值 范围 0~1， 单 击 “继续 ”按钮 。 


本 704 单 击 “ 统 计 ” 按 钮 ， 弹 出 “判别 分 析 : 统计 ”对 话 框 , 选中 “ 单 变量 AVONA ”和 “ 博 
克 斯 M” 复 选 框 ， 单 击 “ 继 续 ” 按 钮 。 

下 505 单 击 “ 分 类 ”按钮 ， 弹 出 “判别 分 析 : 分 类 ”对 话 框 ， 在 “使 用 协 方差 矩阵 ”选项 
组 中 选中 “组 内 ” 单 选 按钮 ， 单 击 “ 继 续 ” 按 钮 。 

人 GE565 单 击 “ 保 存 ” 按 钮 ， 弹 出 “判别 分 析 : 保存 ”对 话 框 ， 选 中 “预测 组 成 员 ” 复 选 框 。 

人 3367 回 到 主 对 话 框 ， 单 击 “ 确 定 ”按钮 ， 便 可 以 得 到 判别 分 析 的 结果 。 


20.1.6 ”结果 判读 


1. 不 同 手术 方式 术 后 感染 情况 分 析 的 结果 判读 


图 20-4 给 出 了 方差 齐 性 检验 的 结果 ， 从 中 可 以 看 到 莱 文 方差 齐 性 检验 的 显著 性 为 0.083， 
大 于 显著 水 平 0.05， 因 此 基本 可 以 认为 样本 数据 之 间 的 方差 是 齐 次 的 。 

图 20-5 给 出 了 单 因素 ANOVA 检验 的 结果 ， 从 中 可 以 看 出 , 组 间 平 方 和 是 0.202, 组 内 平 
方 和 是 6.765， 组 间 平 方 和 的 下 值 为 0.403， 显 著 性 为 0.673， 大 于 显著 水 平 0.05， 因 此 我 们 认 


为 不 同 的 手术 方式 对 是 否 感染 没有 显著 的 影响 。 


方差 齐 性 检验 
感染 与 否 
莱 文 统计 。 自由 度 1 自由 度 2 显著 性 
2.727 2 27 .083 


ANOVA 
感人 与 在 
和 自 F 显著 性 
组 网 202 2 101 403 673 
担 内 6.765 27 251 
总 计 56.967 29 


20-4 方差 齐 性 检验 


图 20-5 ANOVA 检验 结果 


2. 术 后 感染 情况 影响 因素 的 判别 分 析 的 结果 判读 
图 20-6 给 出 了 样本 数量 、 有 效 值 和 排除 值 的 相关 信息 ， 从 中 可 以 看 到 30 个 样本 都 用 于 了 


分 析 ， 不 存在 缺失 值 。 
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20-7 给 出 了 各 组 和 所 有 观测 的 加 权 与 未 加 权 的 有 效 值 ， 组 统计 量 是 对 案例 综合 处 理 摘 
要 表达 的 分 组 细 化 。 


组 统计 
有 效 个 案 数 《成 列 》 
夫 如 权 加 权 
19 19000 
19 19000 
19 19000 
19 19000 
19 “19000 
19 19000 
19 19.000 
19 19000 
11 11000 
性 11.000 
11 11.000 
11 11000 
11 11.000 
11 11.000 
分 析 个 案 处 理 摘要 11 11.000 
未 加 权 个 案 数 个 案 数 ”| 百分比 11 11.000 
有 效 30 909 30 30000 
排除 。 “缺失 或 超出 范围 组 代 三 3 91 Be 
至 少 一 个 缺失 判 则 变 般 0 0 用 
既 色 括 缺失 或 旺 出 范 转 组 0 0 ed 
代码 ， 也 包括 至 少 一 个 急 30 30.000 
失 庆 出 变量 30 。 30000 
= SS 3 91 30 30000 
总 计 33 1000 手术 中 输血 和 30 30000 
图 20-6 个 案 处 理 摘要 图 20-7 组 统计 量 


图 20-8 给 出 了 组 平均 值 的 均等 性 和 协 方差 矩阵 齐 性 的 检验 结果 ， 从 组 平均 值 的 检验 结果 
可 以 看 出 ， 除了 “红细胞 压 积 ” 变量 外 ， 所 有 变量 的 显著 性 均 大 于 0.05， 因 此 我 们 不 能 拒绝 原 
假设 ， 认 为 它们 之 间 的 平均 值 是 相同 的 。 


组 平均 值 的 同等 检验 
码 尔 直 
Lambds F 自由 度 1 自由 度 2 。 显著 性 检验 结果 

月 险 .999 031 1 28 .862 博克 斯 M 75.899 
找 细胞 压 积 361 4.507 1 28 043 

[i 二 — 
生病 如 位 95 138 1 28 713 自由 度 1 36 
手术 罕 续 时 间 .917 2.525 i 28 123 自 亲 度 2 1490.541 
手术 失血 全 1.000 011 1 28 918 县 车 性 081 
手术 中 输血 次 数 937 186 1 28 .182 “对 等 同 媳 休 协 方 其 个 际 的 原 假 一 
手术 中 输血 条 .923 2.326 1 28 138 设 进行 检验 。 


20-8 组 平均 值 均等 性 和 协 方差 矩阵 检验 


对 协 方差 矩阵 齐 性 的 博克 斯 M 检验 结果 表示 显著 性 为 0.081， 大 于 0.05 的 显著 性 水 平 ， 
故 无 法 拒绝 原 假设 ， 认 为 不 同 组 之 间 的 协 方差 矩阵 是 相同 的 。 因 此 数据 符合 进行 判别 分 析 的 前 
提 ， 可 以 进行 判别 分 析 。 
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图 20-9 给 出 了 威 尔 克 Lambda 检验 的 结果 , 威 尔 克 Lambda 检验 用 于 检验 各 个 判别 系数 是 
否 具有 统计 上 的 显著 意义 。 从 显著 性 来 看 ， 判 别 函数 在 10% 的 显著 性 水 平 下 显著 ， 因 此 可 以 
接受 由 该 判别 函数 创建 的 判别 规则 。 


特征 值 威 尔 克 Lambda 
忆 数 特征 值 放 差 百分比 累计 百分比 ”类 型 相关 性 威 尔 克 
1 802a 100.0 1000 667 成 数 析 验 Lambda 卡 方 自由 度 显 营 性 
a. 在 分 析 中 使 用 了 前 1 个 典 则 判别 瑟 数 。 1 .555 14.138 8 .078 


20-9 ”对 判别 函数 的 相关 检验 


20-10 给 出 了 判别 函数 的 系数 和 结构 矩阵, 标准 化 的 判别 系数 给 出 了 诊断 感染 的 判别 依 
据 。 从 中 可 以 看 出 ， 判 别 函 数 主 要 受 “ 月 龄 ” “疾病 部 位 ” “手术 持续 时 间 ” “手术 中 输血 量 ” 


等 变量 的 影响 。 
结构 矩阵 
函数 
1 
人 ET 448 
机 手术 持续 时 间 335 
卫 数 

i 手术 中 和 血 和 322 
i ET 
红细胞 压 积 -280 手术 方式 119 
手术 方式 -242 疾病 敲 位 -.078 
疾病 部 位 -.985 月 龄 037 
手术 持 赎 时间 2.067 手术 失血 重 -.022 
手术 失血 其 -.318 判别 变 重 与 标准 化 开 则 判别 

办 = 函数 之 网 的 汇聚 组 内 相关 性 
EE 2 变 便 按 函数 内 相关 性 的 绝对 

手术 中 输血 全 1249 大 小 排序 。 


图 20-10 ”判别 函数 系数 和 结构 矩阵 
判别 函数 的 具体 形式 如 公式 〈20-1) 所 示 ， 为 线性 标准 判别 函数 。 
了 =-0.588* 月 龄 -0.28 红 细胞 压 积 -0.242 手 术 凡事 -0.985 疾 病 部 位 
+2.067 手 术 持 续 时 间 -0.318 手 术 失 血 量 
一 0.012 手 术 中 输血 次 数 +1.249 手 术 中 输血 量 
预测 的 分 组 结果 作为 新 的 变量 被 保存 ， 从 中 我 们 可 以 看 出 各 个 观测 病例 的 分 组 判别 结果 ， 
并 可 以 通过 SPSS 对 未 分 类 观测 进行 分 类 , 分 类 被 保存 在 “Dis_1” 变 量 中 (如 图 20-11 所 示 ) ， 
“1” 表 示 感 染 ，“0” 表 示 未 感染 ， 这 与 我 们 在 建立 变量 时 的 设置 是 一 致 的 。 同时， 我们 可 以 
看 出 , 系统 依据 判别 函数 对 尚未 观测 到 感染 结果 的 3 名 儿童 依据 判别 函数 给 出 了 分 类 结果 。 至 
此 , 我 们 通过 SPSS 达到 了 依据 这 些 病例 信息 得 出 先天 性 巨 结肠 症 术 后 是 否 发 生 感染 的 诊断 系 
统 与 判断 规则 的 目的 。 


(20-1) 
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200 


BESssssSssssssés 


JM SPSS Stalistics 外 理 各 序 才 | | [unicodeON| | 


图 20-11 分 类 的 判别 结果 


20.2 SPSS 在 经 济 管理 学 科 中 的 应 用 


随 着 我 国 改革 开放 的 实践 和 经 济 理论 的 发 展 ,实证 方法 和 数据 分 析 已 成 为 经 济 研究 中 的 重 
要 方面 。 大量 经 验证 据 的 分 析 和 运用 对 于 经 济 理论 的 发 展 和 决策 的 支持 都 具有 重要 的 意义 。 而 
经 济 实证 研究 离 不 开 现代 统计 分 析 方 法 的 运用 ，SPSS 的 统计 分 析 过 程 为 经 济 管理 研究 提供 了 
有 力 的 帮助 。 回 归 分 析 、 因 子 分 析 、 聚 类 分 析 和 时 间 序列 分 析 等 分 析 方法 是 经 济 管理 研究 中 常 
用 的 分 析 方 法 。 


20.2.1 案例 说 明 与 问题 描述 


股票 价格 是 股票 在 市 场 上 出 售 的 价格 。 它 的 决定 及 其 波动 受制 于 各 种 经 济 、 政 治 因素 ,并 
受 投资 心理 和 交易 技术 等 的 影响 。 概括 起 来 , 影响 股票 市 场 价格 及 其 波动 的 因素 主要 分 为 两 大 
类 : 一 类 是 基本 因素 ; 另 一 类 是 技术 因素 ,最 重要 的 是 基本 因素 。 所 谓 基本 因素 ， 是 指 来 自 股 
票 市 场 以 外 的 经 济 与 政治 因素 及 其 他 因素 , 其 波动 和 变化 往往 会 对 股票 的 市 场 价格 趋势 产生 决 
定性 影响 。 基 本 因素 主要 包括 经 济 性 因素 、 政 治 性 因素 等 。 其 中 ,影响 股票 价格 的 经 济 因素 中 
公认 的 最 为 重要 的 是 财务 因素 。 


20.2.2 ”分 析 目的 、 分 析 思 路 与 数据 选取 


本 案例 的 研究 目的 是 分 析 银 行业 上 市 公司 的 财务 数据 分 析 股 票 价格 的 财务 影响 因素 , 为 对 
银行 业 上 市 公司 的 投资 提供 科学 的 依据 。 

本 案例 的 分 析 思 路 是 : 首先 利用 描述 性 分 析 对 银行 业 上 市 公司 的 财务 数据 进行 基础 性 描 
述 , 以 便 对 整个 行业 形成 直观 的 印象 ; 然后 利用 因子 分 析 提 取 对 银行 业 上 市 公司 股票 价格 影响 
较为 明显 的 因素 , 分 析 银 行业 上 市 公司 股价 的 决定 因素 ; 最 后 利用 回归 分 析 方 法 确定 这 些 因素 
对 股票 价格 的 影响 方向 和 强 弱 。 
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为 利用 银行 业 上 市 公司 的 财务 数据 ， 本 案例 观测 了 流动 比率 、 净 资产 负债 


比率 、 资产 固定 


资产 比率 、 每 股 收益 、 净 利润 、 增 长 率 、 股 价 1 和 公布 时 间 等 数据 ， 所 有 数据 均 来 源 于 WIND 
资讯 。 本 案例 的 原始 数据 如 图 20-12 所 示 。 


| | | I | | 
EE i A SE 而 BR CE a Ge 股价 场 


Marol 
buro1 
Novw-01 
Mar-02 
|buk02 
INov-02 
Mar-03 
Huro3 
INow03 
Mar-04 
|uro4 
Nov-04 
Mar-n5 
Jut05 
INov-05 
Mar-06 
|Juro6 
Nov-05 
Mar-07 
Juro7 
Nov-07 
Mar-08 
buto8 


107155500 
101810650 
104694700 
103975650 
1.02159967 
0.96065900 
0.92562475 
0.94239800 
0.91639725 
0.87541375 
0.90060725 
0.88136280 
0.89066780 
0.86292560 
0.86337380 
0.84941889 
0.96368900 
0.85767500 
0.67430360 
0.98475000 
0.89625000 
0.77400000 


0.020515 
0.009379 
0.013598 
0.013137 
0.013970 
0.013284 
0.011708 
0.011860 
0.011641 
0.010129 
0.009532 
0.009450 
0.008080 
0.009338 
0.009430 
0.010992 
0.010824 
0.011688 
0.009964 
0.010783 
0.009194 
0.009581 
0.006989 


图 20-12 案例 的 原始 数据 


27.041670 
113.224400 

85.340020 

93.344400 

88.401770 

93 .588960 
102.880600 
103.239400 
103.531700 
112.474600 
127.263900 
133.404000 
128 .082900 
235.141300 
117.573100 
107.082400 
105.041700 
110.306100 

96.115660 
116.043800 

97 980650 
105.109500 
156.916200 


20.2.3 ”案例 中 使 用 的 SPSS 方法 


1. 描述 性 分 析 


E a 
0.223000 
0275167 
0.119667 
0.185000 
0.236500 
0.304000 
0.091500 
0.172000 
0.260500 
0.324000 
0111600 
0.190180 
0.284600 
0.347020 
0.111860 
0.1684860 
0.306600 
0.374360 
0115800 
0.245600 
0.390000 


17.766670 
14770400 
14297730 
14723630 
14.103330 
16.502530 
14975750 
13517950 
14.449380 
13294650 
12813330 
11.507880 
12.959120 
11824480 
11524500 
10305200 
12083760 
10311340 
11.563120 
10.417980 
11394800 
11.508880 
11789840 


四 全 
25433100 
30732400 
30.577500 
14.550370 
13879100 
21.894100 
27487830 
19.167760 
21.915030 
23.685940 
44718200 
37.541900 
35.188620 
21.156800 
14.874920 
10.622200 
22.349620 
26.893700 
28 2489E0 
64 .509780 
52343560 


18.56 
18.36 
13.55 
15.21 
13.73 
1243 
13.89 
11.10 
1142 
12.14 
1043 
8.56 
1024 
9.02 
7.55 
6.65 
649 
6.14 
6.12 
5.67 
698 
6.68 
639 


描述 性 分 析 是 对 数据 进行 基础 性 描述 ， 主 要 用 于 描述 变量 的 基本 特征 。SPSS 中 的 描述 性 
分 析 过 程 可 以 生成 相关 的 描述 性 统计 量 ， 如 均值 、 方 差 、 标 准 差 、 全 距 、 峰 度 、 偏 度 等 ， 同 时 
描述 性 分 析 过 程 还 将 原始 数据 转换 为 Z 分 值 并 作为 变量 储存 ， 通 过 这 些 描述 性 统计 量 ， 我 们 
可 以 对 变量 变化 的 综合 特征 进行 全 面 的 了 解 。 


2. 因子 分 析 


因子 分 析 是 一 种 数据 简化 技术 , 它 通 过 研究 众多 变量 之 间 的 内 部 依赖 关系 , 探求 观测 数据 
中 的 基本 结构 , 并 用 少数 几 个 独立 的 不 可 观测 变量 变化 来 表示 其 基本 的 数据 结构 。 这 几 个 假想 
变量 能 够 反映 原来 众多 变量 的 主要 信息 。 


3. 回归 分 析 
回归 分 析 是 研究 一 个 


析 方 法 。 区 


因 变 量 与 一 个 或 多 个 自 变量 之 间 的 线性 或 非 线性 关系 的 一 种 统计 分 
归 分 析 通 过 规定 因 变量 和 自 变 量 来 确定 变量 之 间 的 因果 关系 ,建立 


回归 模型 ， 并 根 


据 实测 数据 来 估算 模型 的 各 个 参数 , 然后 评价 回归 模型 是 否 能 够 很 好 地 拟 合 实测 数据 , 并 可 以 
根据 自 变量 作 进 一 步 预 测 。 


20.2.4 ”数据 文件 的 建立 


首先 在 SPSS 变量 视图 中 建立 变量 “流动 比率 ”“ 净 资产 负债 


“每 股 收益 ”“ 净 利润 ”“ 增 长 率 ” “股价 1” 和 “公布 时 间 ”， 
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比率 ”“ 资 产 固定 资产 比率 ” 


分 别 用 来 表示 流动 比率 、 净 
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资产 负债 比率 、 资 产 固定 资产 比率 、 每 股 收益 、 净 利润 、 增 长 率 、 股 价 和 业绩 公布 时 间 等 观测 
信息 ， 如 图 20-13 所 示 。 


ER 


av 本 天 和 1] -IBM spss statistics 尖 人 二 


20-13 数据 文件 的 变量 视图 


然后 在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 
部 分 数据 如 图 20-14 所 示 。 
者 "spsS 在 引渡 管理 入 应 用 要 洪 sav 其 民 安 1] IBM SPSS Statistics 小 漠视 尖 吕 号 百 这 


| 文件 四 境 错 全 于 看 MV) 孝 据 D)。 转 热 中 分析 同志 的) NHG) 天 用 程序 册 ， 扩展 G 而 DID 陡 册 tt) 
Sa HR 


' 训 人 资产 国定 调 产 比 京 “人 本 服 收益 4 争 利 辣 《P 规 长 村 

107155500 192533 17 76667 3.942450 
101810650 130000 14.77040 46.914300 
223000 14 29773 25 433100 

275167 14.72263 30.732400 

119667 14.10333 30 $77500 

185000 16 60253 14 550370 

236500 14 97575 13879100 

304000 1351795 21894100 

103 531700 091500 14.44938 27 487830 

87541575 112474600 172000 13 29465 19 167780 
90080725 127.283900 C260500| 12 81333 21915030 
88136280 133.404000 324000 1150788 29 586940 
128.082900 111600 12 95912 44718200 


236 141300 .190180 11.82448 37 541900 
117.573100 284600 1162450 35 188620 


图 20-14 数据 文件 的 数据 视图 


.5 SPss 操作 步骤 
1. 银行 业 上 市 公司 股价 及 财务 指标 的 描述 统计 分 析 操 作 步 骤 
人 ES30i 打开 数据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 然 后 在 菜单 栏 中 选择 “分 析 ” 
| “描述 统计 ”| “描述 ”命令 ， 打 开 “ 描 述 ” 对 话 框 ， 将 变量 “流动 比率 ”“ 净 资产 
负债 比率 ”“ 资 产 固定 资产 比率 ”“ 每 股 收益 ”“ 净 利润 "“ 增 长 率 ”“ 股 价 1” 选 入 “ 变 
量 ” 列 表 框 中 。 
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人 ES62 单 击 “ 选 项 ”按钮 ， 弹 出 “描述 : 选项 ”对 话 框 ， 选 中 “最 大 值 ”“ 最 小 值 ”“ 标 准 


差 ”“ 平 均值 ”和 “方差 ” 复 选 框 ， 然 后 单 击 “ 继 续 ” 按 钮 ， 返 


E303 单 击 “ 确 定 ”按钮 ， 即 可 输出 分 析 结果 。 
2. 银行 业 上 市 公司 的 各 个 财务 指标 的 因子 分 析 操 作 步 骤 


人 ES) 打开 数据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 析 ”|“ 降 
维 ”|“ 因 子 ” 命 令 ， 打 开 “ 因 子 分 析 ” 对 话 框 ， 将 “流动 比率 ”“ 净 资产 负债 比率 ” 
“资产 固定 资产 比率 ”“ 每 股 收益 ”“ 净 利润 ”“ 增 长 率 ”“ 股 价 1” 变 量 选 入 “变量 ” 


列表 框 中 。 


E502 单 击 “ 描 述 ” 按 钮 ， 弹 出 “ 


其 他 为 系统 默认 选择 ， 单 击 “ 继 续 ”按钮 ， 保 存 设置 结果 。 


GE563 单 击 “得 分 ”按钮 ， 弹 出 “因子 分 析 : 因 
“显示 因子 得 分 系数 矩阵 ” 复 选 框 ， 单 让 


3. 银行 业 股 票 价格 与 主因 子 财务 指标 的 回归 分 析 


ES6i) 打开 数据 文件 ,进入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 析 ”| “加 
归 ”|“ 线 性” 命令， 打开 “线性 回归 ”对 话 框 ， 将 “股价 1” 变 量 选 入 “ 


列表 框 中 ， 将 “流动 比率 ”和 “净利 润 ” 变 量 选 入 “ 自 变量 ”列表 框 中 。 
本 2 单 击 “ 统 计 ” 按 钮 打开“ 线性 回归 : 统计 ”对 话 框 ， 选 中 “估算 值 ”“ 模 型 拟 合 ” 


和 “ 德 宾 - 沃 森 ” 复 选 框 ， 然 
GE363 单 击 “ 选 项 ”按钮 ， 打 开 “ 线 性 回 
复 选 框 ， 然 后 单 击 “ 


继续 ”按钮 保存 设置 。 


GE563 单 击 “确定 ”按钮 ， 便 可 以 得 到 线性 回归 的 结果 。 


20.2.6 结果 判读 


1. 银行 业 上 市 公司 股价 及 财务 指标 的 描述 统计 分 析 


如 图 20-15 所 示 为 银行 业 上 市 公司 经 营 状况 的 描述 统计 结果 。 


后 单 击 “ 继 续 ” 按 钮 保存 设置 。 
归 : 选项 ”对 话 框 ， 选 中 “在 方程 中 包括 常量 ” 


描述 统计 
` 案 数 最 小 值 最 大 值 平均 值 标准 差 和 莽 
该 动 比率 22 .77400000 1.07155500 .9189855120 .0768336436 006 
兆 殿 产 负 俊 比率 23 006989 .020515 01108852 .002713630 000 
避 产 网 定 纤 产 比率 23 27.041670 236141300 111.3977804 35.88880615 1288.006 
每 股 收益 23 .091500 390000 .22505857 .090158050 008 
净利 网 23 10.305200 17.766670 13.00979348 1.954010448 3.818 
夫 长 幸 23 -3.942450 64.609780 27.42802000 14.85095878 220.551 
股价 1 23 567 1886 103439 397134 15772 
有 效 个 案 数 〈 成 列 ) 22 
图 20-15 ”银行 业 上 市 公司 经 营 状况 的 描述 分 析 结果 
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因子 分 析 : 描述 ”对 话 框 ， 选 中 “初始 解 ” 和 “KMO 和 
巴特 利 特 球形 度 检验 ” 复 选 框 ， 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 结果 。 
GE563 单 击 “旋转 ”按钮 ， 弹 出 “因子 分 析 : 旋转 ”对 话 框 ， 选 中 “最 大 方差 法 ” 复 选 框 ， 


子 得 分 ”对 话 框 ， 选 中 “保存 为 变量 ” 逢 | 
“继续 ”按钮 ， 保 存 设置 结果 。 


因 


变量 ” 
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由 图 20-15 可 知 ， 在 2001 年 ~2008 年 的 各 个 季度 中 ， 我 国 银行 业 上 市 公司 股价 的 平均 值 
为 10.3439 元 ， 最 大 值 与 最 小 值 之 间 的 全 距 为 13.19 元 ， 标 准 差 为 3.9 元 ， 可 见 我 国 银行 业 上 
市 公司 的 股价 在 样本 期 间 波动 幅度 较 大 。 另 外 ,就 净利 润 指标 来 看 , 我 国 银行 业 上 市 公司 净利 
润 均值 为 13 亿 元 ， 可 见 在 样本 期 间 我 国 银行 业经 营 状况 良好 。 


2. 银行 业 上 市 公司 的 各 个 财务 指标 的 因子 分 析 


图 20-16 给 出 了 KMO 和 巴特 利 特 检验 的 结果 ， 其 中 KMO 值 越 接近 1 表示 越 适 合 做 因子 
分 析 ， 从 中 可 以 看 到 KMO 的 值 为 0.743， 表 示 比 较 适 合 做 因子 分 析 。 巴 特 利 特 球形 度 检 验 的 
原 假 设 为 相关 系数 矩阵 为 单位 阵 ， 显 著 性 为 0.000 小 于 显著 水 平 0.05， 因 此 拒绝 原 假设 ， 表 示 
变量 之 间 存 在 相关 关系 ， 适 合 做 因子 分 析 。 

20-17 给 出 了 每 个 变量 共同 度 的 结果 。 左 侧 表示 每 个 变量 可 以 被 所 有 因素 所 能 解释 的 方 
差 ， 右 侧 表示 变量 的 共同 度 。 从 中 可 以 看 到 ， 因 子 分 析 的 变量 共同 度 都 非常 高 ， 表 明 变 量 中 的 
大 部 分 信息 均 能 够 被 因子 所 提取 ， 说 明 因子 分 析 的 结果 是 有 效 的 。 


公 因 子 方差 
初 好 提取 

流动 比率 1.000 .818 
牢 赁 产 负 个 比率 1.000 861 
KMo 和 巴特 利 特 检验 资产 国定 资产 比率 1.000 .606 
每 股 收益 1.000 ,565 
KMO 取样 适 切 性 合 数 。 743 净利 油 1.000 .895 
巴特 利 特 球形 度 检 验 。 近似 卡 方 95.892 增长 率 1.000 664 
自由 度 21 股价 1 1.000 .870 

显 葛 性 000 提取 方法 ， 主 成 分 分 析 法 。 


20-16 银行 业 财务 指标 的 KMO 和 巴特 利 特 的 检验 结果 20-17 银行 业 财务 指标 的 变量 共同 度 


图 20-18 给 出 了 因子 贡献 率 的 结果 。 左 侧 为 初始 特征 值 ， 中 间 为 提取 主因 子 结果 ， 右 侧 为 
旋转 后 的 主因 子 结果 。“ 总 计 ” 指 因子 的 特征 值 ，“ 方 差 百 分 比 ” 表 示 该 因子 的 特征 值 占 总 特 
征 值 的 百分比 ，“ 累 积 %” 表 示 累 积 的 百分比 。 其 中 只 有 前 两 个 因子 的 特征 值 大 于 1， 并 且 前 
两 个 因子 的 特征 值 之 和 占 总 特征 值 的 75.392%， 因 此 ， 提 取 前 两 个 因子 作为 主因 子 。 


总 方差 解释 
初始 特征 值 提取 埠 符 乎 方 和 殿 特 喜 荷 子 方 和 
成 分 总 计 方 笨 百分比 。 累积 % 方 前 百分比 | 累积 鲍 计 方 着 百分比 累积 % 
1 3.916 55.938 55.938 3916 55938 55.938 2718 38.830 38.830 
2 1.362 19.454 75.392 1.362 19.454 75.392 2.559 36.562 。 75.392 
3 731 10.443 85.835 
4 545 7779 93614 
5 197 2813 。 96.427 
6 193 2753 99.180 
区 057 820 100.000 


提取 方法 。 主 成 分 分 析 法 。 
图 20-18 银行 业 财 务 指标 的 因子 贡献 率 


图 20-19 给 出 了 旋转 后 的 因子 载荷 值 ， 其 中 旋转 方法 是 凯撒 标准 化 的 正 交 旋转 法 。 通 过 因 
子 旋转 ,各 个 因子 有 了 比较 明确 的 含义 第 一 个 因子 与 流动 比率 和 净 资 产 负债 比率 相关 性 最 强 ， 
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因此 将 流动 比率 作为 对 第 一 个 因子 的 解释 。 第 二 个 因子 与 净利 润 最 为 相关 , 因此 分 别 将 净利 润 
作为 对 第 二 个 因子 的 代表 。 


3. 银行 业 股 票 价格 与 主因 子 财务 指标 的 回归 分 析 旋转 后 的 成 分 矩阵 5 
对 利用 因子 分 析 得 到 的 主因 子 进行 回归 分 析 , 可 进一步 发 er 


掘 我 国 银行 业 股价 与 其 主要 财务 指标 的 关系 。 


谈 动 比率 742 517 


由 上 文 的 对 银行 业 财务 指标 的 因子 分 析 , 我 们 发 现 可 以 用 | 这 = 比率 400 837 
两 个 主因 子 流动 比率 、 净 利润 ) 来 代 蔡 解释 所 有 6 个 财务 指 | ERRELEE 。 -247 -739 
标 提供 的 近 80% 的 信息 。 因 此 ,下 面 将 利用 分 析 的 两 个 主因 于 | | 
一 一 流动 比率 和 净利 润 两 个 财务 指标 , 作为 自 变量 对 因 变 量 银 | O71 -12 
行业 上 市 公司 的 平均 股价 进行 回归 。 0 | 204 


图 20-20 给 出 了 评价 模型 的 检验 统计 量 。 从 该 图 可 以 得 到 
R、R 方 、 调 整 的 R 方 、 标 准 估算 的 误差 及 德 宾 - 活 森 统计 量 。 
如 本 实验 中 回归 模型 RR 方 是 0.838, 说明 回 归 的 拟 合 度 非常 高 ， 图 20-19 银行 业 财 务 指标 的 


旋转 方法 ， 凯撒 正 志 化 最 大 方差 法 。 
.旋转 在 3 次 旬 代 后 已 收效 。 


并 且 德 宾 - 活 森 为 2.2， 说 明 模 型 残 差 不 存 自 相 关 ， 该 回归 模型 旋转 后 因子 载荷 
非常 优良 。 
模型 摘要 9 
标准 估算 的 误 
模型 R R 方 调整 后 R 方 答 德 宾 - 活 看 
1 .924a 853 .838 1.59817 2.209 
a. 预测 变量 ，( 常 量 ), 净利 润 , 流动 比率 
b. 因 变 量 ; 股价 1 


图 20-20 银行 业 财 务 指标 回归 模型 的 评价 统计 量 
图 20-21 给 出 了 ANOVA 检验 的 结果 。 由 该 图 可 以 得 到 回归 部 分 的 值 为 55.224, 相应 的 
显著 性 值 是 0.000， 小 于 显著 水 平 0.05， 因 此 可 以 判断 由 流动 比率 、 净 利润 两 个 财务 指标 对 银 
行业 上 市 公司 的 平均 股价 解释 能 力 非常 显著 。 


ANOVAa 
模型 下 方 和 自由 度 均 方 F 显 黄 性 
1 辐 归 282.102 2 141.051 55.224 000 
残 差 48.529 19 2.554 
总 计 330.631 21 


a. 因 变 重 :股价 1 
b. 预测 变量 (常量 ), 净利 润 , 流动 比率 


图 20-21 银行 业 财 务 指标 的 ANOVA 检验 结果 
20-22 给 出 了 线性 回归 模型 的 回归 系数 及 相应 的 一 些 统计 量 。 从 中 可 以 看 到 线性 回归 模 
型 中 的 流动 比率 和 净利 润 的 系数 分 别 为 21.352 和 1.125, 说 明 流动 比率 的 小 部 分 增加 会 带动 银 
行业 上 市 公司 股价 近 21 倍 的 增加 ， 说 明 并 证 实 了 银行 业 公司 的 股价 与 银行 资产 的 流动 性 高 度 
相关 的 现实 状况 , 这 是 因为 银行 资产 的 流动 性 决定 了 该 银行 的 经 营 稳 健 性 , 是 利润 产生 的 根本 
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前 提 。 另 外 ， 线 性 回归 模型 中 的 流动 比率 和 净利 润 两 个 指标 的 t 值 分 别 为 2.89 和 3.927， 相 应 
的 显著 性 为 0.000， 说 明 系 数 非常 显著 ， 这 与 ANOVA 检验 的 结果 一 致 ， 即 银行 业 股 价 高 度 受 
流动 比率 和 净利 润 两 个 财务 指标 的 影响 。 

系数 


未 标准 化 系数 标准 化 系数 
模型 8 标准 误差 Beta t 显著 性 
1 (营业 ) -23.800 4.486 -5.306 000 
流动 比率 21.352 7.388 413 2.890 009 
净利 机 1.125 286 562 3.927 001 
3. 因 变 量 : 股价 1 


20-22 ”回归 系数 


综 上 所 述 ， 在 银行 业 数据 中 ， 可 以 用 两 个 主因 子 〈 流 动 比率 、 净 利润 ) 来 代替 解释 所 有 6 
个 财务 指标 提供 的 近 80% 的 信息 。 因 子 分 析 的 变量 共同 度 都 非常 高 ， 表 明 变量 中 的 大 部 分 信 
息 均 能 够 被 因子 所 提取 ， 说 明 因子 分 析 的 结果 是 有 效 的。 


20.3 SPSS 在 自然 科学 中 的 应 用 


空气 污染 已 成 为 一 个 日 益 严重 的 科学 和 社会 问题 ,对 空气 污染 的 防治 和 监测 成 为 各 主要 城 
市 的 一 项 重要 工作 。SPSS 的 非 参 数 检验 、 时 间 序 列 分 析 和 聚 类 分 析 等 分 析 方 法 为 空气 污染 的 
分 析 和 监测 研究 提供 了 有 效 的 帮助 。 


20.3.1 案例 说 明 与 问题 描述 


随 着 经 济 的 发 展 和 社会 的 进步 , 环境 污染 问题 已 受到 越 来 越 多 人 的 关注 。 生态 环境 方面 已 
经 成 为 一 个 城市 综合 竞争 力 的 重要 组 成 部 分 。 对 城市 污染 问题 的 研究 和 判断 对 于 工业 布局 、 城 
市 发 展 战略 和 产业 政策 的 制定 具有 重要 的 指导 意义 。1997 年 国务 院 决定 对 重点 城市 进行 空气 
质量 周报 ,空气 质量 周报 包括 对 几 种 主要 污染 物 的 监测 状况 ， 以 空气 污染 指数 的 形式 报告 。 空 
气 污染 指数 反映 了 一 个 城市 的 污染 情况 和 污染 的 变动 规律 ,对 环保 工作 的 开展 具有 重要 的 指导 


20.3.2 ”分析 目的 、 分 析 思 路 及 数据 选取 


本 案例 的 研究 目的 是 对 全 国 部 分 主要 城市 的 空气 质量 进行 横向 比较 ,分 析 我 国 当前 空气 污 
染 的 总 体 情况 和 地 区 差异 ， 为 环境 政策 的 制定 提供 科学 的 依据 ; 同时 ， 对 代表 性 城市 的 空气 污 
染 状况 进行 分 析 和 预测 , 全 面 把 握 空气 污染 状况 的 发 展 趋势 , 最 后 对 各 主要 城市 的 空气 污染 状 
况 进行 合理 分 类 ， 为 国家 环境 政策 的 制定 提供 科学 合理 的 依据 。 

本 案例 的 分 析 思 路 是 : 首先 利用 描述 性 统计 分 析 方 法 对 各 主要 城市 的 空气 质量 进行 横向 比 
较 ; 然后 利用 非 参数 检验 方法 检验 各 城市 空气 污染 在 年 内 的 分 布 状况 是 否 具有 一 致 性 , 并 判断 
在 全 国 范围 内 是 否 存在 影响 空气 质量 的 共同 因素 ;最 后 利用 时 间 序 列 分 析 方法 对 其 代表 性 城市 
的 空气 污染 状况 进行 分 析 和 预测 。 
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本 案例 选取 了 兰州 、 大 同 、 西 安 、 苏 州 、 济 南 、 南 宁 、 北 京 等 城市 270 天 的 空气 质量 报告 
数据 ， 记 录 了 空气 污染 指数 ， 另 外 选取 了 某 代表 性 城市 2301 天 的 数据 ， 利 用 时 间 序 列 分 析 方 
法 对 代表 性 城市 的 空气 污染 状况 进行 分 析 和 预测 ,所 有 数据 均 来 源 于 环保 部 网 站 及 各 省 市 环保 
厅 (局 ) 的 网 站 及 相关 报告 。 


本 案例 原始 数据 如 图 20-23 所 示 。 


图 20-23 案例 原始 数据 


20.3.3 ”案例 中 使 用 的 SPSS 方法 
1. 描述 性 分 析 


描述 性 分 析 是 对 数据 进行 基础 性 描述 ， 主 要 用 于 描述 变量 的 基本 特征 。SPSS 中 的 描述 性 
分 析 过 程 可 以 生成 相关 的 描述 性 统计 量 ， 如 均值 、 方 差 、 标 准 差 、 全 距 、 峰 度 和 偏 度 等 ， 同 时 
描述 性 分 析 过 程 还 将 原始 数据 转换 为 Z 分 值 并 作为 变量 储存 ， 通 过 这 些 描述 性 统计 量 ， 我 们 
可 以 对 变量 变化 的 综合 特征 进行 全 面 的 了 解 。 
2. 非 参数 检验 


非 参数 检验 是 相对 于 参数 检验 而 言 的 , 非 参数 检验 由 一 般 不 涉及 总 体 参数 而 针对 总 体 的 某 
些 一 般 性 假设 而 得 名 , 又 称 分 布 自由 检验 。 非 参数 检验 在 统计 分 析 和 实际 工作 中 具有 广泛 的 应 
用 。 非 参数 检验 是 不 需要 对 总 体 分 布 情况 进行 严格 限定 的 统计 推断 方法 , 这 类 检验 方法 的 假设 
前 提 比 参数 检验 要 少 得 多 并 且 容 易 满足 。 


3. 指数 平滑 分 析 


指数 平滑 分 析 是 在 移动 平均 模型 基础 上 发 展 起 来 的 一 种 时 间 序 列 分 析 预 测 法 ,其 原理 


是 任 


一 期 的 指数 平滑 值 都 是 本 期 实际 观察 值 与 前 一 期 指数 平滑 值 的 加 权 平均 。 该 分 析 方 法 的 思想 是 
对 过 去 值 和 当前 值 进行 加 权 平均 ， 以 及 对 当前 的 权 数 进行 调整 以 抵消 统计 数值 的 摇摆 影响 , 得 
到 平滑 的 时 间 序列 。 指 数 平滑 分 析 不 舍弃 过 去 的 数据 , 只 对 过 去 的 数据 给 予 逐 渐 减 弱 的 影响 程 


度 (权重 ) 。 
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20.3.4 数据 文件 的 建立 


1. 对 空气 质量 进行 横向 比较 的 数据 文件 的 建立 


在 SPSS 变量 视图 中 建立 变量 “兰州 ”“ 大 同 ”“ 西 安 ”“ 苏 州 ”“ 济 南 ”“ 北 京 ”“ 南 
昌 ” 和 “南宁 ”， 分 别 用 来 衡量 各 主要 城市 的 污染 指数 情况 ， 数 据 文 件 命名 为 “SPSS 在 自然 
科学 中 的 应 用 1”， 如 图 20-24 所 示 。 


| RAM ps Sietes HR = 
sm aa aa bao wD hf, sms Ra aaa ya Eo an 


无 
无 
无 
无 
无 
无 
无 
无 


图 20-24 数据 文件 “SPSS 在 自然 科学 中 的 应 用 1” 的 变量 视图 
然后 在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 
部 分 数据 如 图 20-25 所 示 。 


| 起 spss 在 自打 中 的 四 用 1 sy | 下 于 和 1] -IaM 5pSS Statistics 总 汪 和 SH 
去 件 全 。 雹 全 ) 曾 面 W) 牙 树 中 ) 革 拉 站。 分析。 前 0 本 Ri(G) 未 LU) 扩 央 09 而 Di 于 区 4) 


图 20-25 数据 文件 “SPSS 在 自然 科学 中 的 应 用 1” 的 数据 视图 
2. 各 城市 空气 污染 在 年 内 的 分 布 状况 是 否 具有 一 致 性 的 数据 文件 的 建立 
在 SPSS 变量 视图 中 建立 变量 “空气 污染 指数 ”和 “城市 ”， 分 别 用 来 衡量 各 主要 城市 的 
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污染 指数 情况 。 其 中 ，“ 城 市 ”变量 使 用 “1~8” 分 别 表 示 “ 兰 州 ”“ 大 同 ”“ 西 安 ”“ 苏 州 ” 
“济南 ”“ 北 京 ” “南昌 ”和 “南宁 ”， 数 据 文件 命名 为 “SPSS 在 自然 科学 中 的 应 用 2”， 
如 图 20-26 所 示 。 


起 SPSS 在 自 枯 科学 中 的 应 用 2 cav [ 握 年 1] -IBM SP5S Statistics 玫 宇 呈 全 吕 一 一口 党 


图 20-26 数据 文件 “SPSS 在 自然 科学 中 的 应 用 2” 的 变量 视图 
然后 在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 
部 分 数据 如 图 20-27 所 示 。 


入 spss 和 Mpcht9 友 所 2.6av | 要 锯 未 1] - 16M SPSS Staristics 政 锯 交 所 器 J 
E02 钛 栅 [中 分 煌 国清 呈 。 西 MG) 藉 用 程序 CU 扩 和 o。 亩 PGID。 邦 号) 


— 习 
[mL: 22 个 交 量 


i | Ra | sa | ge | sm | ge | wa 
108 


[EEC 


图 20-27 数据 文件 “SPSS 在 自然 科学 中 的 应 用 2” 的 数据 视图 
3. 代表 性 城市 空气 质量 预测 的 数据 文件 的 建立 
在 SPSS 变量 视图 中 建立 变量 “污染 指数 ”， 用 来 衡量 代表 性 城市 5 年 的 污染 指数 情况 ， 
数据 文件 命名 为 “SPSS 在 自然 科学 中 的 应 用 3”， 如 图 20-28 所 示 。 


然后 在 SPSS 活动 数据 文件 的 数据 视图 中 ,把 相关 数据 输入 到 各 个 变量 中 ,输入 完毕 后 的 
部 分 数据 如 图 20-29 所 示 。 
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起 spss 在 a 中 向 3 sav | 下 蝎 生 1] -IBM SPSS Statistics 到 号 示 竺 - oO x 
文件 加 二 樟 “二 看 WW 孝 捅 D) 转换 0 分 析 册 。 直 滑 亿 ) 于 HG) 。 交 用 程序 扩 时 0 。 畜 DGD 帮助 史 


对 齐 双重 角色 
王 右 。 人 村 度 入 靖 入 


[EM SPSS Stalistics 处 理 程 友 护 线 | UnicodeON | | 


图 20-28 数据 文件 “SPSS 在 自然 科学 中 的 应 用 3” 的 变量 视图 


Sperm P rv EE1] -BM SPSS Satitics Rm = 上 % 


出] | |] sa | a | | 训 


20-29 数据 文件 “SPSS 在 自然 科学 中 的 应 用 3” 的 数据 视图 


20.3.5 ”SPSS 操作 步骤 


1. 各 主要 城市 空气 污染 指数 的 描述 性 横向 比较 操作 步骤 


EEY 打开 数据 文件 “SPSS 在 自然 科学 中 的 应 用 1" 进入 SPSS Statistics 数据 编辑 器 窗口， 
然后 在 菜单 栏 中 选择 “分 析 ”| “描述 统计 ”| “描述 ”命令 ， 打 开 “描述” 对 话 框 。 

GE 将 “兰州 "“ 大 同 ”“ 西 安 " “苏州” “济南 ”“ 南 宁 ” “南昌 ”和 “北京 ” 选 入 “变量 ” 
列表 框 中 。 

GE 单 击 “ 选 项 ”按钮 ， 弹 出 “描述 : 选项 ”对 话 框 ， 选 中 “最 大 值 ”“ 最 小 值 ”“ 平 均 
值 ”“ 标 准 差 ”"“ 峰 度 ”和 “ 偏 度 ”， 然 后 单 击 “ 继 续 ” 按钮， 返回 ”描述 ”对 话 框 

ED? 单 击 “确定 ”按钮 ， 即 可 输出 显示 结果 。 
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2. 各 主要 城市 空气 污染 指数 年 内 的 分 布 状况 是 否 具有 一 致 性 的 检验 操作 步骤 


ES6i) 打开 数据 文件 “SPSS 在 自然 科学 中 的 应 用 2”， 在 菜单 栏 中 选择 “分 析 ”|“ 非 参数 检 
F“ 针 对 多 个 独立 样本 的 检验 ”对 话 框 。 


验 ”|“ 旧 对 话 框 ”| “K 个 独立 样本 ”命令 ， 打 姑 


本 0 从 源 变 量 列表 框 中 选择 “空气 污染 指数 ”变量 ， 
列表 框 中 ， 选 择 “ 城 市 ”变量 ， 单 击 加 | 按钮 使 之 进入 “分 组 变量 ”列表 框 中 ， 单 击 “ 定 


义 范围 ”按钮 ， 弹 出 “多 个 独立 样本 : 定义 范 
6 下 703 单 击 “ 选 项 ” 按钮， 打开 “多 个 独立 样本 : 选项 ”对 话 框 ,选中 “描述 ”“F 


复 选 框 ， 单 击 “继续 ”按钮 。 


单 击 国 | 按钮 使 之 进入 “检验 变量 列表 ” 


转 


”对 话 框 ， 输 入 分 组 变量 的 范围 


G504 单 击 “确定 ”按钮 ， 即 可 输出 检验 结果 。 


3. 代表 性 城市 空气 质量 预测 的 指数 平滑 操作 


分 位 数 ” 


ES6i) 打开 数 据 文件 “SPSS 在 自然 科学 中 的 应 用 3” 进入 SPSS Statistics 数据 编辑 器 窗口 ， 
在 菜单 栏 中 选择 “数据 ”|“ 定 义 日 期 和 时 间 ” 命 令 ， 打开“ 定义 日 期 ”对 话 框 ,在 
“个 案 是 ”列表 框 中 选择 “天 ” 在 “第 一 个 个 案 是 ”选项 组 的 “日 ”文本 框 中 输入 
数据 开始 的 具体 日 为 1， 然 后 单 击 “ 确 定 ”按钮 ， 完 成 时 间 变 量 的 定义 。 


本 2 在 菜单 栏 中 选择 “分 析 ”|“ 时 间 序 列 预测 ”|“ 创 建 传统 模型 
列 建 模 嚣 ”对话 框 ， 将 “污染 指数 ”变量 选 入 “ 因 变量 ”列表 框 
拉 列 表 框 中 选择 “指数 平滑 ” 


选项 。 


» 和 人 人 人 
命令 ， 


打开 


“时 间 序 


h， 在 “方法 ”下 


本 03 单 击 “ 条 件 ” 按 钮 ， 打 开 “ 时 间 序 列 建 模 器 : 指数 平滑 条 件 ” 对 话 框 ， 选 中 “简单 ” 
单 选 按钮 ， 单 击 “ 继 续 ” 按 钮 保存 设置 。 
GE 单 击 “ 统 计 ” 选 项 卡 ， 选 中 “参数 估算 值 ” 复 选 框 ， 然 


GES65 单 击 “ 确 定 ”按钮 ， 便 可 以 得 到 指数 了 


20.3.6 ”结果 判读 
1. 各 主要 城市 空气 污染 指数 的 描述 性 横向 比较 


图 20-30 给 出 了 描述 性 分 析 的 主要 结果 ， 从 中 可 以 看 出 ， 兰 州 的 空气 污染 情况 最 为 严重 ， 
平均 空气 污染 指数 达到 了 中 度 污染 的 水 平 , 苏州 的 空气 质量 最 佳 , 平均 空气 污染 指数 处 于 良好 
状态 ， 此 外 苏州 每 天 的 空气 污染 状况 较为 稳定 。 


后 单 击 “ 继 续 ” 按 钮 保存 设置 。 
F 滑 法 建 模 的 结果 。 


描述 统计 
个 案 数 最 小 值 最 大 值 平均 值 标准 差 偏 度 妖 度 
统计 统计 统计 统计 统计 统计 。 标准 误差 。。” 统计 标准 误杀 
Mm ”269 18 500 16559 114471 1.655 149 1.860 296 
大 同 269 1000 50000 119.4833 66.56932 2977 .149 12.054 296 
西安 269 00 34500 842900 2515010 4198 149 43.223 296 
苏州 269 2200 15900 69.9963 22.42841 679 .149 .752 296 
济南 269 5500 23800 966468 2813410 1.754 149 4584 .296 
北京 269 3300 29300 941673 3269040 1.750 .149 5.395 296 
_ 十 昌 ,269 3400 35000 986877 4134591 2285 149 8735 ‘296 
南宁 269 2800 50000 98.8216 66.05768 4.362 149 22149 296 
有 效 个 案 数 (成 列 》 269 


20-30 ”描述 性 统计 量 
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2. 各 主要 城市 空气 污染 指数 年 内 的 分 布 状况 是 否 具有 一 致 性 的 检验 


图 20-31 给 出 了 两 个 变量 的 “个 案 数 ”“ 平 均值 ”“ 标 准 差 ”“ 最 小 值 ”和 “最 大 值 ” 等 
描述 性 统计 量 。 从 描述 性 统计 量 中 ， 我 们 可 以 对 全 国 的 空气 污染 状况 有 一 个 全 局 的 认识 。 


描述 统计 
百 分 位 数 
第 50 个 《中 
系数 平均 值 标准 差 最 小 值 最 大 值 第 25 个 位 数 ) 第 75 
空气 污染 产 数 2152 103.46 63.543 0 500 72.00 88.00 111.00 
城市 2152 4.50 2.292 1 8 2.25 4.50 6.75 


图 20-31 描述 性 统计 量 


图 20-32 给 出 了 克 和 鲁 斯 卡尔 - 沃 利 斯 五 检验 相关 的 检验 统计 量 ， 从 中 可 以 看 出 ， 渐 近 显著 
性 为 0.000， 小 于 显著 水 平 。 故 拒绝 原 假设 ， 认 为 8 个 代表 性 城市 的 空气 污染 情况 存在 显著 


差异 。 

3. 代表 性 城市 空气 质量 预测 的 指数 平滑 

图 20-33 给 出 了 模型 的 基本 描述 , 从 中 可 以 看 出 , 所 建立 的 指数 平滑 法 的 因 变 量 标签 是 “ 污 
染指 数 ”， 模 型 名 称 为 “模型 1”， 模 型 的 类 型 为 简单 非 季节 性 。 


检验 统计 a 
= 气 行 估 莉 数 
卡 方 412.391 
自由 度 7 
少 近 号 车 性 000 模型 描述 
a. 丰 验 斯 卡尔 - 活 利 斯 模型 类 型 
模型 ID 。 行 全 指数 。 模型 1 。 简单 


b, 分 机 变 重 ， 城 市 
20-32 ”检验 统计 量 20-33 ”模型 描述 
图 20-34 给 出 了 模型 的 8 个 拟 合 度 指标 ,包括 这 些 指 标的 平均 值 、 最 小 值 、 最 大 值 及 百 分 
位 数 。 其 中 ,平稳 RR 方 值 为 0.139， 而 及 方 值 为 0.263， 这 是 由 于 因 变 量 数 据 为 季节 性 数据 ， 
因此 平稳 及 方 更 具有 代表 性 。 从 两 个 及 方 值 来 看 ， 该 指数 平滑 法 的 拟 合 情 况 比较 良好 。 


模型 拟 合 度 
位 数 

拟 合 统计 平均 值 “标准 误差 。 最 小 值 。 ”最 大 什 5 10 25 50 75 90 95 
ELMEREE l 139 139 139 139 .139 139 139 139 139 

R 方 _ 263 263 263 263 263 263 263 263 263 263 
_RMSE 31.509 31.509 31.509 31509 31509 31509 31509 31509 31509 31.509 

MAPE 18.735 18735 18735 18735 18735 18735 18735 18735 18735 18735 

MaxAPE ~ 256.286 256.286 256.286 256.286 256.286 256.286 256.286 256.286 256.286 256.286 

MAE 18.340 18.340 18.340 18.340 18.340 18.340 18.340 18340 18.340 18.340 

MaxAE 380.376 380.376 380.376 380.376 380.376 380.376 380.376 380.376 380.376 380.376 

正 老 从 BIG 6.904 6904 6904 6904 6904 6904 6904 6904 6904 6.904 


20-34 ”模型 拟 合 度 


图 20-35 给 出 了 模型 的 拟 合 统计 量 和 杨 - 博 克 斯 Q 统计 量 。 平 稳 R 方 值 为 0.139， 与 模型 
拟 合 图 中 的 平稳 及 方 一 致 。 杨 -博克 斯 Q 统计 量 值 为 311.626， 显 著 性 为 0.000， 因 此 拒绝 残 差 
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序列 为 独立 序列 的 原 假设 , 说 明 模 型 拟 合 后 的 残 差 序 列 是 存在 自 相关 的 , 建议 采用 ARIMA 模 


型 继续 拟 合 。 
模型 统计 
模型 拟 合 度 统 
计 杨 -博克 斯 Q(19) 
模型 预测 变 售 数 黎民 方 统计 DF 显著 性 离 群 值 数 
污染 指数 -模型 1 0 .139 “311.626 17 000 0 


20-35 ”模型 统计 量 表 


图 20-36 给 出 了 指数 平滑 法 模型 参数 估计 值 。 从 该 图 可 以 看 到 本 实验 拟 合 的 指数 平滑 法 的 
水 平 Alpha 值 为 0.38， 显 著 性 为 0.00， 不 仅 作用 很 大 而 且 非 常 显著 。 


指数 平滑 法 模型 参数 
模型 估算 标准 误差 t 显著 性 
污染 指数 -模型 _1 ”不 转换 。 Alpha 《水平 ) 380 016 23.412 000 


图 20-36 参数 估计 值 
图 20-37 给 出 了 污染 指数 平滑 法 的 拟 合 图 和 观测 值 。 污 染指 数 序 列 整 体 上 成 波动 状态 , 拟 
合 值 和 观测 值 曲 线 在 整个 区 间 中 几乎 重合 ,因此 可 以 说 明 指数 平滑 法 对 污染 指数 的 拟 合 情 况 非 
常 好 。 通 过 指数 平滑 法 的 拟 合 图 我 们 可 以 发 现 ， 该 城市 的 污染 指数 出 现 过 三 次 剧烈 波动 ， 并 且 
总 体 上 的 波动 较为 剧烈 ， 但 是 最 近 波 动 相对 平缓 ， 说 明 污染 控制 政策 开始 发 挥 效力 。 


-一 实测 

S00.007 

4ooooj 
EE 如 由 
名 | 指 | 型 
§ 和 | 名 
三 和 

200.007] 让 

100.00”] 


20-37 ”指数 平滑 法 的 拟 合 图 


20.4 SPSS 在 社会 科学 中 的 应 用 


随 着 管理 精细 化 和 分 析 技 术 的 发 展 , 社会 科学 中 的 定量 研究 越 来 越 受 到 重视 , 定量 分 析 的 
结果 已 成 为 决策 的 重要 依据 和 参考 。 科 学 准确 的 分 析 结 果 离 不 开 现代 统计 分 析 方 法 的 运用 ， 
SPSS 的 统计 分 析 过 程 为 社会 科学 的 定量 研究 提供 了 一 种 方便 的 实现 方式 。 因 子 分 析 和 聚 类 分 
析 是 社会 科学 研究 中 常用 的 分 析 方法 。 
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20.4.1 案例 说 明 与 问题 描述 


物质 生产 始终 是 人 类 社会 生存 发 展 的 基础 ,直接 创造 财富 的 制造 业 依然 是 国民 经 济 重要 的 
支柱 产业 。 高 度 发 达 的 制造 业 和 先进 的 制造 技术 成 为 衡量 一 个 国家 综合 经 济 实力 和 科技 术 平 的 
重要 标志 ,是 一 个 国家 在 竞争 激烈 的 国际 市 场 获胜 的 关键 因素 。 新 型 国际 分 工 下 ， 随 着 发 达 国 
家 的 制造 业 结构 向 高 级 化 和 柔性 化 升级 , 其 生产 环节 开始 大 规模 地 向 国外 转移 。 中 国 制造 业 依 
靠 其 强大 的 劳动 力 优势 和 广阔 的 国内 市 场 , 成 为 世界 制造 业 转移 的 主要 目的 地 。 对 各 制造 业 行 
业 发 展 的 影响 因素 研究 成 为 一 个 重要 的 课题 , 它 对 于 制造 业 行业 的 发 展 战略 和 国家 产业 政策 的 
制定 都 具有 重要 的 参考 价值 。 


20.4.2 ”分析 目 的 、 分 析 思 路 及 数据 选取 


本 案例 的 研究 目的 是 对 影响 制造 业 中 不 同行 业 的 影响 因素 进行 分 析 , 为 各 制造 业 行业 的 发 
展 战略 提供 科学 依据 , 同时 对 制造 业 行业 进行 合理 分 类 , 为 国家 产业 政策 的 制定 提供 科学 合理 
的 依据 。 

本 案例 的 分 析 思 路 是 : 首先 利用 因子 分 析 提 取 对 制造 业 行业 竞争 力 影响 较为 明显 的 因 
素 ， 分 析 它 们 对 制造 业 行业 竞争 力 的 影响 ， 然 后 利用 聚 类 分 析 方法 按照 各 种 影响 行业 在 这 
些 影响 因素 维度 上 的 取 值 对 制造 业 行业 划分 类 型 ， 为 分 行业 产业 政策 的 制定 提供 科学 合 
的 依据 。 

本 案例 选取 了 我 国 40 个 行业 2007 年 工业 增加 值 率 、 总 资产 贡献 率 、 资 产 负 债 率 、 工 业 成 本 
费用 利润 率 、 流 动 资产 周转 率 、 产 品 销售 率 、 企 业 单位 数 、 工 业 总 产值 、 工 业 增 加 值 、 资 产 总 计 、 
流动 资产 总 计 、 流 动 资产 年 平均 余额 、 固 定 资产 原 值 、 固 定 资产 净值 年 平均 余额 、 负 债 合计 、 流 
动 负债 合计 、 所 有 者 权益 、 产 品 销售 收入 、 产 品 销售 成 本 、 产 品 销售 税金 及 附加 、 本 年 应 缴 增值 
税 、 利 润 总 额 和 从 业 人 员 年 平均 人 数 的 观测 数据 作为 衡量 制造 业 竞争 力 的 初始 指标 ， 数 据 来 源 于 
《中 国 统计 年 鉴 》 和 各 行业 的 统计 年 鉴 。 本 案例 的 原始 数据 如 图 20-38 所 示 。 


府 业 工业 增加 计 率 〔%) ”总 资产 页 献 军 (为 ) ”资产 负 贷 它 (%) ”工业 成 本 锦 用 利润 率 (和 %) 。 流动 流产 周 特 牵 产品 销 告 率 《%) 。 企业 单位 效 【 家 ) 。 工业 总 产值 《 亿 元 ) 
传 月 设 各 贞洁 业 5104 14B7 61 伍 124 207 ET 7537 00 9.20183 
手纸 及 纸 和 品 业 77.72| 全 50 3 加 7779 398 EE 184.00 6,30005 
SE 4369 五 FE] 2125 2.45 5 2389 00 2.13061 
色 金 属 矿 洒 先 业 42.53 3109 好 引 24.39 260 Ex 2.165.00 2.20075 
| 印刷 业 和 记录 媒介 的 El] 1 Eu EE 332 5784 300400 1.365 3 
笠 削 造 业 29.76 EN Gad 472 S60 S663 2400 1097 
后 似 表态 雯 化、 本 2653, 全 08 Ey 564 399| 5793 语 14000 17.458 08 
| 医 夯 制 造 业 3066 人 1564 到 加 739| 282 F751 6644.00 6.07096 
站 贡品 业 3706. 但 和 3 1033 216 57 65 4.427 00 506234 

| 77.29| 本 引 2474， EE 162 10041 0 

| 孝 信 请 用 操 市 造 业 2 1121 印 包 446 264 Ea 77914 00 18.73331 

| 29.00, 二 14 全 22| 520| 270, 7 42 14.770.00 7500 
陋 信 设备 、 计 复 机 下 2873, 全 好 扰民 551 311 774 7.452 00 5.153 49 
| 29.27 717 Ey 5323 350 E29 7852.00 3.52054 
水 的 生产 和 使 订 业 2667 161 全 而 49 269 5773 411000 2.42494 
27.66 1197 5 57 249 84 G76.00 325 4 
臣 治 加工 、 米 信守 8 N71 人 1 性 EE 194 5770 506300 211757 
司 油 和 天 然 亏 开 下 业 26.42 965 EE] 386: 2.57 Ea] 4067.00 208679 
赔 气 生产 和 住友 全 3 E33 1 486 Ey 2.146 00 17 B50 88 
医 他 丈 矿 业 2739, 1405 5 753 274 779 了 299100 天 76BB0 
| 至 、 毛 应 、 天 万 3594 1459 8 1093 184 437 574800 [| 
以 副食 Rn 工业 19.64 919 如 上 | 4.26| 265 Ez 1556.00 4.12080 
刁 村 in 工 玉木、 三 。 2770, 20 EY 552 272 Ey 36% 00 3.46241 
降 演 开采 和 洗 迁 业 26.32| 1163 EE 47 244 7 93 15.376.00 8,120 4 
惟 属 刘 品 业 31.17 1424 5677| 756 261 F787 24.276.00 15.559.44 
[ 通 运 答 识 入 制 这 业 26.73 1970 0 5.42 303 9912 7.181.00 3370301 
必 具 名 车 业 2 人 7 双 如 三 715 339 EY9 670100 18.03188 
,学 原 衬 区 化 学 制品 26.30 1276 EE 512 254 9 18008 .00 11.447 08 


图 20-38 案例 原始 数据 
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20.4.3 ”案例 中 使 用 的 SPSS 方法 


1. 因子 分 析 


因子 分 析 是 一 种 数据 简化 的 技术 , 它 通过 研究 众多 变量 之 间 的 内 部 依赖 关系 , 探求 观测 数 
据 中 的 基本 结构 , 并 用 少数 几 个 独立 的 不 可 观测 变量 变化 来 表示 其 基本 的 数据 结构 。 这 几 个 假 
想 变量 能 够 反映 原来 众多 变量 的 主要 信息 。 


2. 聚 类 分 析 


聚 类 分 析 是 根据 研究 对 象 的 特征 按照 一 定 标准 对 研究 对 象 进行 分 类 的 一 种 分 析 方 法 ， 它 使 组 
内 的 数据 对 象 具 有 最 高 的 相似 度 ， 而 组 间 有 具有 较 大 的 差异 性 。 聚 类 分 析 可 以 在 没有 先 验 分 类 的 情 
况 下 通过 观察 对 数据 进行 分 类 ， 聚 类 分 析 在 科学 研究 和 实际 的 生产 实践 中 都 具有 广泛 的 应 用 。 


20.4.4 数据 文件 的 建立 


在 SPSS 变量 视图 中 建立 变量 “行业 ” “工业 增加 值 率 ”“ 总 资产 贡献 率 ” “资产 负 债 率 ” 
“工业 成 本 费用 利润 率 ”“ 流 动 资产 周转 率 ”“ 产 品 销售 率 ”“ 企 业 单 位 数 ”“ 工 业 总 产值 ” 
“工业 增加 值 ”“ 资 产 总 计 ”“ 流 动 资产 总 计 ”“ 流 动 资产 年 平均 余额 ”“ 固 定 资产 原 值 ”“ 固 
定 资产 净值 年 平均 余额 ” “负债 合计 ”“ 流 动 负 债 合计 ”“ 所 有 者 权益 ”、 “产品 销售 收入 ” 
“产品 销售 成 本 ”“ 产 品 销售 税金 及 附加 ”“ 本 年 应 缴 增值 税 ”“ 利 润 总 额 ” 和 “从 业 人 员 年 
平均 人 数 ”， 分 别 用 来 衡量 不 同行 业 发 展 的 各 种 因素 ， 如 图 20-39 所 示 。 


国 ,spss 下 Ht 十字 中 的 李 用 say 有 强生 1] -I6M SPS5 Statistics 站 志和 加 全 名 
SND PEE SE MSD WHT IS SM BG SHEF TRE EO Mh 


区 :到 | 
| 从 业 入 员 年 平均 人 数 


20-39 数据 文件 的 变量 视图 


在 SPSS 活动 数据 文件 的 数据 视图 中 ， 把 相关 数据 输入 到 各 个 变量 中 ， 输 入 完毕 后 的 部 分 
数据 如 图 20-40 所 示 。 
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生产 和 让 


图 20-40 数据 文件 的 数据 视图 


20.4.5 ”SPSS 操作 步骤 


1. 制造 业 各 行业 发 展 影响 因素 的 因子 分 析 操作 步 又 


6 本 TY 打开 数据 文件 ， 进 入 SPSS Statistics 数据 编辑 器 窗口 ， 在 菜单 栏 中 选择 “分 析 ”|“ 降 
维 ”| “因子 ”命令 ,弹出 “因子 分 析 ” 对 话 框 , 将 “工业 增加 值 率 ”“ 总 资产 贡献 率 ” 
“资产 负债 率 ”“ 工 业 成 本 费用 利润 率 ”“ 流 动 资产 周转 率 ”“ 产 品 销售 率 ”“ 企 业 单 
位 数 ”“ 工 业 总 产值 ”““ 工 业 增加 值 ”“ 资 产 总 计 ”“ 流 动 资产 总 计 ”“ 流 动 资 产 年 平均 
余额 “固定 资产 原 值 “固定 资产 净值 年 平均 余额 “负债 合计 ”流动 负债 合计 ”所 
有 者 权益 ”“ 产 品 销售 收入 ”“ 产 品 销售 成 本 ”“ 产 品 销售 税金 及 附加 ”“ 本 年 应 缴 增 
值 税 ”“ 利 润 总 额 ” 和 “从 业 人 员 年 平均 人 数 ” 选 入 “变量 ”列表 框 中 。 

GE562 单 击 “描述 ”按钮 ， 弹 出 “因子 分 析 : 描述 ”对 话 框 ， 选 中 “初始 解 ” 和 “KMO 和 

巴特 利 特 球形 度 检验 ” 复 选 框 ， 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 结果 。 

本 03 单 击 “ 旋 转 ” 按 钮 ， 弹 出 “因子 分 析 : 旋转 ”对 话 框 ， 选 中 “最 大 方差 法 ” 复 选 框 ， 
其 他 为 系统 默认 选择 ， 单 击 “ 继 续 ” 按 钮 ， 保 存 设置 结果 。 

人 ES5364 单 击 “ 得 分 ”按钮 ， 弹 出 “因子 分 析 : 因子 得 分 ”对 话 框 ， 选 中 “保存 为 变量 ”和 
“显示 因子 得 分 系数 矩阵 ” 复 选 框 ， 单 击 “ 继 续 ”按钮 回 到 主 对话 框 。 

GE565 单 击 “ 确 定 ” 按 钮 ， 输 出 分 层 聚 类 分 析 的 结果 。 


2. 制造 业 各 行业 不 同类 型 的 聚 类 分 析 操 作 步 又 


G07 在 菜单 栏 中 选择 “分 析 ”|“ 分 类 ”|“ 系 统 聚 类 ”命令 ， 弹 出 “系统 聚 类 分 析 ” 对 话 框 。 

E30 从 源 交 量 列表 框 中 选择 “FAC1-1”“FAC2-1” 和 “FAC3-1” 变 量 ， 然 后 单 击 国 | 按钮 
将 它们 选 入 “变量 ”列表 框 中 ， 选 择 “ 行 业 ” 变 量 ， 单 击 国 | 按 钮 将 其 选 入 “个 案 标 
注 依据 ”列表 框 中 。 

GE563 在 “ 聚 类 成 员 ” 选 项 组 中 选中 “单个 解 ” 单 选 按钮 。 

人 ES63 单 击 “ 图 ”按钮 ， 弹 出 “系统 聚 类 分 析 : 图 ”对 话 框 ， 选 中 “谱系 图 ” 复 选 框 。 

ES65 单 击 “ 确 定 ”按钮 ， 输 出 分 层 聚 类 分 析 的 结果 。 
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20.4.6 ”结果 判读 


1. 制造 业 各 行业 发 展 影响 因素 的 因子 分 析 
图 20-41 给 出 了 KMO 和 巴特 利 特 的 检验 结果 ， 其 


中 KMO 值 越 接近 1 表示 越 适合 做 因子 分 析 ， 从 该 图 可 
以 看 到 KMO 的 值 为 0.783， 表 示 比 较 适 合 做 因子 分 析 。 


巴特 利 特 球形 度 检验 的 原 假设 为 相关 系数 矩阵 为 单位 


阵 ， 显 著 性 为 0.000， 小 于 显著 水 平 0.05， 因 此 拒绝 原 


假设 表示 变量 之 间 存 在 相关 关系 ， 适 合 做 因子 分 析 。 


KMO 和 巴特 利 特 检验 
KMO 取样 适 切 性 集 数 。 783 
巴特 利 待 球形 度 检验 。 近似 卡 方 ”4660.021 
自由 度 253 
且 苦 性 000 


20-41 行业 发 展 影响 因素 的 KMO 和 
巴特 利 特 检验 结果 


图 20-42 给 出 了 每 个 变量 共同 度 的 结果 。 左 侧 表示 每 个 变量 可 以 被 所 有 因素 所 能 解释 的 方 
差 ， 右 侧 表示 变量 的 共同 度 。 从 该 图 可 以 看 到 ， 因 子 分 析 的 变量 共同 度 都 非常 高 ， 表 明 变 量 中 


的 大 部 分 信息 均 能 够 被 


因子 所 提取 ， 说 明 因 子 分 析 的 结果 是 有 效 的 。 


20-43 给 出 了 因子 贡献 率 的 结果 。 其 中 只 有 前 三 个 因子 的 特征 值 大 于 1， 并 且 前 三 个 因 
子 的 特征 值 之 和 占 总 特征 值 的 94.087%， 因 此 ， 提 取 前 三 个 因子 作为 主因 子 。 
公 因 子 方差 总 方 莽 解 释 
加 约 。 |】 提取 和 由 村 证 人 提取 家 和 下方 和 次 特 吉 和 和 
工业 划 加 信 系 1000 1 k 。 系 职 入 。。 SS 计 | 方 过 机 分 比 。 妥 职 各。 总 计 | 方丈 百分比 。 累积 % 
ET 1000 16773 72927 72927 16773 72927 72927 16755 72849 72649 
贷 产 从 信 素 1000 3563 15493 B8419 3563 15493 B9419 3543 15405 88254 
工 古 关 机 局 各 下 1304 5668 94087 1304 5658 94087 1342 583 94087 
二 二 砚 产 二 让 582 2964 97051 
i i 34 1498 98s50 
企业 和 位 数 1000 ee 
5 加 438 99626 
工业 增加 仁 1000 下 a 
? 1 
人 六 生计 1 209 0 057 99968 
站 > o03 014 99983 
谍 动 产生 下 均 余 全 1000 元 本 
全 定 这 产 和 人 1000 i 
[TREETT oo 有 
鳞 信 合计 J 四 001 100000 
城 动 仙 信 合计 1.900 5235E5 000 “100000 
有 青 权 玲 1000 399E5 000 “100000 
产品 销售 收入 1900 1306E5 5580E5 100000 
产品 销售 成 本 1000 6.835E.6 。 2972E5 100000 
产品 销售 多 及 附 如 1000 1722E6 7488E6 100000 
利生 全 1000 9779E7 4252E6 100000 
二 第 应 哲人 模 1000 5485E7 2385E6 100000 
从 业 人 只 年 的 人 数 1000 2411E9 1048E8 100000 
抽取 方法 ， 主 成 人 分 天 法 EECDZTT 
图 20-42 行业 发 展 影响 因素 的 图 20-43 行业 发 展 影响 因素 的 因子 贡献 率 
变量 共同 度 
图 20-44 给 出 了 旋转 后 的 因子 载荷 值 ， 其 中 旋转 方法 是 凯撒 标准 化 的 正 交 旋转 法 。 通 过 因 


子 旋转 ， 各 个 因子 有 了 比较 明确 的 含义 。 我 们 可 以 看 出 第 一 个 因子 与 “企业 单位 数 ”“ 工 业 总 
产值 ” “工业 增加 值 ”“ 资 产 总 计 ”“ 流 动 资产 总 计 ”“ 流 动 资产 年 平均 余额 ” “固定 资产 原 
值 ”“ 固 定 资产 净值 年 平均 余额 ”“ 负 债 合计 ”“ 流 动 负债 合计 ”“ 所 有 者 权益 ”“ 产 品 销售 
收入 ”“ 产 品 销售 成 本 ”“ 产 品 销售 税金 及 附加 ”“ 本 年 应 缴 增值 税 ”“ 利 润 总 额 ” 和 “从 业 
人 员 年 平均 人 数 ” 相 关 性 较 强 , 因此 将 第 一 个 因子 称 为 资产 因子 ; 第 二 个 因子 与 “工业 增加 值 
率 ”“ 总 资产 贡献 率 ”“ 资 产 负债 率 ”“ 工 业 成 本 费用 利润 率 ” 相 关 ， 因 此 将 第 二 个 因子 命名 
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为 效率 因子 ; 第 三 个 因子 与 “流动 资产 周转 率 ” 和 “产品 销售 率 ” 有 关 ， 因 此 将 第 三 个 因子 命 
名 为 流动 性 因子 。 
各 因子 得 分 也 作为 新 变量 被 保存 ， 如 图 20-45 所 示 ， 为 下 一 步 的 聚 类 分 析 打 好 了 基础 。 


许 转 后 的 成 分 短 阵 = 


保 权 方 款 ， 主 夏 分 分 前 法。 
英 轩 方法 ， 沁 内 正 者 化 最大 方法 


训 并 竺 在 4 次 机 代 寻 已 收 反 。 


图 20-44 ”行业 发 展 影 响 因素 的 旋转 后 因子 载荷 图 20-45 ”因子 得 分 
2. 制造 业 各 行业 不 同类 型 的 聚 类 分 析 


EH 
HU 
和 改 用 I 证 号 和 
人 


图 20-46 “分 层 聚 类 分 析 的 冰 柱 图 


分 层 聚 类 分 析 的 冰 柱 图 给 出 了 各 类 之 间 的 距离 ,从 最 后 一 行 向 前 我 们 可 以 依次 看 出 不 同 的 
聚 类 数量 下 的 分 类 方式 。 
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使 用 平均 联接 (组 间 》 的 谱系 图 
重 白 标 度 的 距离 取 类 搬 合 
0 5 10 15 20 25 


煤炭 开采 和 洗 先 业 24| 
非 金属 矿物 制品 业 35| 


通用 设备 制造 业 12| 
石油 和 天 然 气 开采 业 “18| 
水 的 生产 和 供应 业 15| 
医药 凤 短 业 8| 
卜 弃 蓉 源 和 废旧 材料 。 34| 
其 他 采矿 业 20| 
金属 制品 业 25| 


文教 体育 用 品 制造 业 11 
化 学 原料 及 化 党 州 品 。 28| 
食品 改造 业 16| 
木村 加工 及 木 、 竹 、 23| 
通信 设备 、 计 算 机 及 13| 
塑料 制品 业 14| 
黑色 金属 矿 采 选 业 31 
工艺 品 及 其 他 制造 业 。 32| 


化 掌 寿 维 制造 业 29| 

农 副 食品 加 工业 22 

工业 企业 33| 
> 

专用 设备 制造 业 章 

烟草 制品 业 9 


石油 加 工 、 炼 焦 及 核 17| 
黑色 金属 冶炼 及 压延 。 30| 
印刷 业 和 记录 媒介 的 5| 
有 色 金 属 治 炼 及 压延 3 


有 色 金 属 矿 采 选 业 4 
仪器 仪表 及 文化 、 办 7| 
家 具 制 造 业 27| 


交通 运输 设备 制造 业 。 26| 
纺织 服装 、 鞋 、 帆 州 。 38| 
纺织 业 37| 
非 金属 矿 采 先 业 36| 
皮革 、 毛 皮 、 羽 毛 21 
电气 机 械 及 器 材 造 。 39| 
饮料 制造 业 6| 
燃气 生产 和 供应 业 19 


造 锋 及 然 制 品 业 2| 
检 胶 昨 品 业 10| 
电力 、 热 力 的 生产 和 ”40| 


图 20-47 ” 聚 类 分 析 谱 系 图 


聚 类 分 析 谱 系 图 给 出 了 聚 类 每 一 次 合并 的 情况 。 

结合 聚 类 分 析 谱 系 图 ， 建 议 分 为 五 类 : 电力 热力 的 生产 和 销售 归 为 一 类 ; 造纸 和 纸 制品 业 、 
橡胶 制品 业 归 为 一 类 ; 非 金属 矿 采 选 业 、 电 气 机械 及 器 材 制造 与 皮革 、 毛 皮 、 羽 毛 归 为 一 类 ; 饮料 
制造 业 归 为 一 类 ; 其 余 行业 归 为 一 类 。 通过 聚 类 分 析 我 们 可 以 清楚 地 区 分 各 个 行业 竞争 力 影响 因素 
的 差异 。 
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题 


ait, weeo Hainap20 wv 


| 一 
全 


视频 文件 : \sample\ 上 机 题 \chap20\... 


20.1 某 机 构 为 了 研究 我 国 服装 业 上 市 公司 的 股票 价格 与 上 市 公司 财务 报表 呈现 的 财务 
信息 的 关系 ， 搜 集 了 上 市 公司 的 流动 比率 、 净 资产 负债 比率 、 资 产 固定 资产 比率 、 每 股 收益 


、 净 利润 、 增 长 率 等 财务 指标 ， 部 分 数据 如 下 表 所 示 。 


股票 编号 流动 比率 负债 比率 资产 比例 每 股 收益 
1 0.96065900 0.013284 93.588960 0.185000 
2 0.92562475 0.011708 102.880600 0.236500 
3 0.94239800 0.011860 103.239400 0.304000 
4 0.91639725 0.011641 103.531700 0.091500 
5 0.87541375 0.010129 112.474600 0.172000 
6 0.90080725 0.009532 127.283900 0.260500 
区 0.88136280 0.009450 133.404000 0.324000 
8 0.89066780 0.008080 128.082900 0.111600 
Es 0.86292560 0.009338 236.141300 0.190180 
10 0.86337380 0.009430 117.573100 0.284600 
11 0.84941880 0.010992 107.082400 0.347020 
12 0.86368900 0.010824 105.041700 0.111860 
13 0.85767500 0.011688 110.306100 0.184860 
14 0.87430380 0.009964 98.115880 0.306600 
15 0.88475000 0.010763 116.043800 0.374360 


(1) 将 “流动 比率 ”“ 净 资产 负债 比率 ”“ 资 产 固 定 资产 比率 ”“ 每 股 收益 ”“ 净 利润 ” 


“增长 率 ”等 财务 指标 进行 因子 分 析 ， 提 取 主 因子 并 计算 各 个 因子 得 分 。 
(2) 利用 因子 分 析 得 到 的 主因 子 对 其 进行 回归 分 析 ， 进 一 步 发 掘 我 国 服装 业 股 价 与 


要 财务 指标 的 关系 。 


其 主 


20.2 ”本 题目 给 出 了 1996 年 一 季度 到 2008 年 二 季度 我 国 房地产 价格 指数 的 数据 , 其 中 以 
1996 年 一 季度 为 基期 , 并 设 定 为 100。 试用 时 间 序 列 等 方法 分 析 我 国 房地产 价格 的 走势 ， 部 分 


数据 如 下 表 所 示 。 
季度 房地产 价格 指数 
1996Q1 100 
1996Q2 96.60489 
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( 续 表 ) 
季度 房地产 价格 指数 
1996Q3 87.77722 
1996Q4 95.31348 
1997Q1 122.3734 
1997Q2 103.9335 
1997Q3 119.8608 
1997Q4 105.4707 
1998Q1 115.6328 
1998Q2 123.0282 
1998Q3 110.156 
1998Q4 106.1271 
1999Q1 113.4815 
1999Q2 121.8994 
1999Q3 114.5574 


(1) 将 房地产 价格 指数 在 SPSS 中 定义 为 时 间 序 列 ， 时 间 频 率 为 “年 ， 季 度 ”。 
(2) 采用 指数 平滑 的 方法 分 析 拟 合 钢铁 产量 的 稳定 长 期 的 走势 。 

(3) 绘制 指数 平滑 法 的 拟 合 图 和 观测 值 图 表 。 
(4) 采用 ARIMA 模型 分 析 拟 合 房地产 价格 指数 的 走势 ， 并 绘制 ARIMA 模型 的 拟 合 图 
和 观测 值 图 表 。 
20.3 在 现代 经 济 周期 理论 中 ， 固 定 资产 投资 周期 是 影响 宏观 经 济 周期 波动 的 一 个 直接 
的 、 物 质 性 的 主导 因素 。 本 题目 搜集 了 从 1978 年 ~2007 年 我 国 国民 生产 总 值 和 固定 资产 投资 
总 额 的 数据 ， 部 分 数据 如 下 表 所 示 。 
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年 份 固定 资产 投资 (十 亿 ) 
1978 225.45 41.87 
1980 276.3765 66.19678 
1981 322.0911 73.9777 
1982 364.07 78.26888 
1983 413.5162 86.7446 
1984 $15.1107 124.1364 
1985 554.5721 158.3782 
1986 578.8222 174.0094 
1987 643.3237 214.6864 
1988 678.6035 224.5416 
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( 续 表 ) 
年 份 国民 生产 总 值 〈 十 亿 ) 固定 资产 投资 〈 十 亿 ) 
1989 649.8945 153.4606 
1990 756.7301 168.0821 
1991 864.2196 209.9379 
1992 981.9088 268.8869 


(1) 将 两 个 变量 在 SPSS 中 定义 为 时 间 序列 ， 时 间 频 率 为 “年 ”。 

(2) 采用 ARIMA 模 型 分 析 拟 合 我 国 固定 资产 投资 的 走势 ， 并 绘制 ARIMA 模 型 的 拟 合 图 
和 观测 值 图 表 。 

(3) 对 我 国 固定 资产 投资 和 国民 生产 总 值 进行 回归 分 析 , 探讨 两 者 之 间 的 定量 影响 关系 。 


20.4 ”为 了 对 少年 的 体质 状况 进行 科学 的 监测 和 分 析 ， 研 究 者 随机 抽取 485 名 中 小 学 生 


， 观 测 了 脉搏 、 身 高 、 体 重 、 坐 高 、 胸 围 等 身体 指标 和 立定 跳远 、 小 球 掷 远 、 体 前 届 、10 米 

往返 跑 和 双 脚 连续 跳 等 体质 指标 [原始 数据 来 自 于 《统计 分 析 方 法 与 SPSS 应 用 教程 》 (清华 

大 学 出 版 社 ，2009) 一 书 ， 作 者 进行 了 相应 的 补充 和 修正 ]， 部 分 数据 如 下 表 所 示 。 

脉搏 (次 /min) 坐 高 (cm) 胸围 (cm) 

100 106.1 16.3 59.8 50.5 
88 109.8 15.4 62.1 54.0 
82 118.0 19.9 66.5 50.5 
ES 115.0 23.1 63.5 58.0 
96 115.4 18.8 63.8 54.0 
96 116.8 21.0 64.7 52.5 
99 103.6 Ig 58.0 53.0 
100 109.5 17.3 62.5 52.0 
92 111.0 18.9 61.2 56.0 
86 120.5 21.0 60.5 55.0 
94 107.2 17.4 60.2 56.0 
78 104.2 14.0 58.9 50.5 
104 99.0 15.6 57.0 54.5 
88 115.0 21.4 64.0 55.0 
102 100.5 15.2 58.7 49.0 
92 113.7 18.7 65.2 51.5 
112 107.4 16.7 60.3 52.5 
104 113.1 19.0 63.2 55.0 
110 11 18.6 64.4 56.0 
141 14.2 10.7 62 4.7 
121 9.5 7.6 65 4.8 
111 16.5 13.6 5.9 5 


501 


SPSS 统计 分 析 从 入 门 到 精通 〈 第 四 版 ) 


( 续 表 ) 
立定 跳远 小 球 掷 远 体 前 屈 往返 跑 连续 跳 
130 15.0 6.5 62 5.6 
110 14.0 5.0 6.7 5.8 
90 7.0 8.8 6.6 5.9 
75 4.0 10.0 73 6.1 
108 7.0 15.0 6.5 7.1 
71 4.5 4.5 8.4 8.1 
115 93 8.9 6.2 8.8 
90 17.0 4.2 6.5 9.7 
89 6.0 13.4 7.5 6.1 
88 11.0 12.1 7.2 11.4 
58 6.0 6.5 4.6 
80 10.0 6.9 7.7 
92 55 7.8 11.1 
84 8.0 7.0 4.1 
80 5.0 795 5.0 
108 5.0 5.9 5 


(1) 试 分 析 代 表 性 身体 指标 和 体质 指标 的 相关 性 。 
(2) 试 将 学 生 分 为 4 类 ， 作 为 对 学 生体 质 观察 的 代表 性 样本 。 
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